#

quantization-aware-training

Here are 28 public repositories matching this topic...

666DZY666 / micronet

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference)、Low-Bit(≤2b)/Ternary and Binary(TWN/BNN/XNOR-Net); post-training-quantization(PTQ), 8-bit(tensorrt); 2、 pruning: normal、regular and group convolutional channel pruning; 3、 group convolution structure; 4、batch-normalization fuse for quantization. deploy: tensorrt, fp32/fp16/int8(ptq-calibration)、op-adapt(upsample)、dynamic_shape

pytorch pruning convolutional-networks quantization xnor-net tensorrt model-compression bnn neuromorphic-computing group-convolution onnx network-in-network tensorrt-int8-python dorefa twn network-slimming integer-arithmetic-only quantization-aware-training post-training-quantization batch-normalization-fuse

Updated Oct 6, 2021
Python

openvinotoolkit / nncf

Neural Network Compression Framework for enhanced OpenVINO™ inference

nlp sparsity compression tensorflow transformers pytorch classification pruning object-detection quantization semantic-segmentation bert hawq mmdetection mixed-precision-training quantization-aware-training

Updated May 31, 2022
Python

SpursLipu / YOLOv3v4-ModelCompression-MultidatasetTraining-Multibackbone

YOLO ModelCompression MultidatasetTraining

yolo pruning object-detection modelcompression mobilenetv3 quantization-aware-training multidataset

Updated May 15, 2022
Python

intel / neural-compressor

Intel® Neural Compressor (formerly known as Intel® Low Precision Optimization Tool), targeting to provide unified APIs for network compression technologies, such as low precision quantization, sparsity, pruning, knowledge distillation, across different deep learning frameworks to pursue optimal inference performance.

sparsity deep-learning pruning quantization knowledge-distillation auto-tuning low-precision quantization-aware-training post-training-quantization

Updated Jun 4, 2022
Python

alibaba / TinyNeuralNetwork

TinyNeuralNetwork is an efficient and easy-to-use deep learning model compression framework.

deep-learning pytorch pruning model-compression model-converter quantization-aware-training

Updated Jun 3, 2022
Python

sayakpaul / Adventures-in-TensorFlow-Lite

This repository contains notebooks that show the usage of TensorFlow Lite for quantizing deep neural networks.

inference pruning tensorflow-lite tensorflow-2 on-device-ml tf-hub model-quantization model-optimization quantization-aware-training post-training-quantization tf-lite-model

Updated May 19, 2022
Jupyter Notebook

clovaai / frostnet

FrostNet: Towards Quantization-Aware Network Architecture Search

computer-vision deep-learning pytorch style-transfer classification object-detection quantization network-architecture semantic-segmentation optimizers quantization-aware-training int8-quantization post-quantization quantization-efficient-network

Updated Mar 23, 2021
Python

THU-MIG / torch-model-compression

针对pytorch模型的自动化模型结构分析和修改工具集，包含自动分析模型结构的模型压缩算法库

pytorch pruning quantization tensorrt model-compression qat onnx reparameterization tensorrt-conversion quantization-aware-training acnet

Updated Apr 25, 2022
Python

openvinotoolkit / mmdetection

OpenVINO Training Extensions Object Detection

sparsity compression computer-vision deep-learning pytorch ssd faster-rcnn object-detection instance-segmentation mask-rcnn retinanet onnx openvino cascade-rcnn fcos onnxruntime atss quantization-aware-training nncf

Updated Jun 3, 2022
Python

yashbhalgat / QualcommAI-MicroNet-submission-MixNet

3rd place solution for NeurIPS 2019 MicroNet challenge

competition quantization mixnet model-pruning model-compression neurips-2019 micronet-challenge unstructured-pruning quantization-aware-training

Updated Nov 8, 2019
Python

mlzxy / qsparse

Train neural networks with joint quantization and pruning on both weights and activations using any pytorch modules

neural-network pytorch pruning model-compression quantization-aware-training

Updated Dec 25, 2021
Python

bharathsudharsan / CNN_on_MCU

Code for paper: 'Multi-Component Optimization and Efficient Deployment of Neural-Networks on Resource-Constrained IoT Hardware'

optimization quantization neuralnetworks edge-computing graph-optimization efficient-inference tflite cmsis-nn c-code-generator tflite-conversion tinyml quantization-aware-training

Updated Apr 22, 2022
Jupyter Notebook

DeadAt0m / LSQFakeQuantize-PyTorch

FakeQuantize with Learned Step Size(LSQ+) as Observer in PyTorch

lsq pytorch quantization qat quantization-aware-training learned-step-size torchlsq fakequantize

Updated Dec 18, 2021
C++

HaoranREN / TensorFlow_Model_Quantization

A tutorial of model quantization using TensorFlow

machine-learning tensorflow tensorflow-lite tflite model-quantization inference-efficiency quantization-aware-training

Updated Aug 2, 2021
Python

jeshraghian / QSNNs

Quantization-aware training with spiking neural networks

deep-learning neuroscience networks spiking-neural-networks quantization backpropagation neural snn spiking quantization-aware-training

Updated Feb 18, 2022
Python

rishivar / Resnet-18

Image classification done with Mindspore technology

cifar-10 resnet18 mindspore quantization-aware-training

Updated Jan 24, 2021
Python

yashbhalgat / QualcommAI-MicroNet-submission-EfficientNet

Submission name: QualcommAI-EfficientNet. MicroNet Challenge (NeurIPS 2019) submission - Qualcomm AI Research

competition pytorch quantization mixnet model-pruning model-compression neurips-2019 efficientnet micronet-challenge unstructured-pruning quantization-aware-training

Updated Dec 19, 2019
Python

SangbumChoi / PyTorch_Quantization

all methods of pytorch quantization based on resnet50

resnet-50 cifar-10 pytorch-implementation pytorch-lightning quantization-aware-training

Updated Oct 3, 2021
Python

qnn

stracini-git / qnn

Training neural nets with quantized weights on arbitrarily specified bit-depth

mnist lenet quantization cifar10 binary-neural-networks quantized-neural-networks resnet18 quantization-algorithms quantization-aware-training

Updated May 7, 2021
Python

marekninja / master-thesis

One Bit at a Time: Impact of Quantisation on Neural Machine Translation

transformers pytorch transformer seq2seq nmt quantization encoder-decoder quantization-aware-training fully-quantized-transformer

Updated May 15, 2022
Jupyter Notebook

SuperbTUM / Transformer-Quantization

Transformer quantization and binarization exploration

binarization transformer-encoder quantization-aware-training

Updated May 9, 2022
Jupyter Notebook

TanyaChutani / Quantization_Tensorflow

Quantization for Object Detection in Tensorflow 2.x

object-detection quantization tensorflow2 quantization-aware-training

Updated May 31, 2022
Python

brandontang892 / quant_aware_L2Grad_regularization

Our work implements novel L2-Norm gradient (L2Grad) and variance of the weight distrbution (VarianceNorm) regularizers for quantization-aware training such that the distribution of weights are more compatible with post-training quantization especially for low bit-widths. We provide a theoretical basis that directly relates L2-Grad with post quantization test accuracy through a first order Taylor Series expansion followed by the reduction to an adversary with an L2 budget, in which we apply the Cauchy-Schwarz inequality to provide the desired bounds. We empirically show that L2Grad and VarianceNorm can both match the performance of L1Grad and outperform it on certain bit-widths. We also show that a regularization scheme that combines L2Grad and VarianceNorm in a novel "regularization scheduling" methodology can give even better results in terms of post-quantization accuracy, tested on uniform and piecewise linear quantization.

cnn pytorch regularization cauchy-schwarz-inequality wandb quantization-aware-training

Updated May 15, 2021
Jupyter Notebook

sjlee94 / AI

CNN quantization

cnn quantization-aware-training

Updated Jul 7, 2021
Python

rishivar / adversarial-notebooks

Experimental Adversarial Attack notebooks on CV models

denoising-autoencoders cifar-10 gtsrb-dataset fgsm adversarial-attacks resnet-18 quantization-aware-training

Updated Sep 14, 2020
Jupyter Notebook

Flexible_quantization

lixilinx / Flexible_quantization

A simple formula supports eight types of quantization

quantization-aware-training

Updated Aug 1, 2021
Python

iabd / QuantizedNMT

8 bit quantizated Transformer for neural machine translation.

machine-translation transformer nmt quantization quantization-aware-training

Updated Aug 20, 2021
Python

LorenzoValente3 / Autoencoder-for-FPGA

Autoencoder model for FPGA implementation using hls4ml. Repository for Applied Electronics Project.

compression fpga deep-learning autoencoder-mnist autoencoder-classification quantization-aware-training hls4ml

Updated May 5, 2022
Jupyter Notebook

Improve this page

Add a description, image, and links to the quantization-aware-training topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the quantization-aware-training topic, visit your repo's landing page and select "manage topics."