Neural Network Implementation for Fashion-MNIST Classification

This project implements a custom neural network for classifying Fashion-MNIST images. It includes multiple optimization algorithms, hyperparameter tuning, and visualization tools.

Features

Custom Neural Network Implementation
Multiple Optimization Algorithms:
- Stochastic Gradient Descent (SGD)
- Momentum
- Nesterov Accelerated Gradient (NAG)
- RMSprop
- Adam
- NAdam
Flexible Network Architecture
Hyperparameter Tuning with Wandb
Comprehensive Visualization and Analysis

link:

wandb link: https://api.wandb.ai/links/na21b051-indian-institute-of-technology-madras/blgf2sve

Project Structure

DA6401_assignment1/
│
├── models/
│   ├── neural_network.py   # Neural network implementation
│   └── optimizers.py       # Optimization algorithms
│
├── utils/
│   ├── data_loader.py      # Data preprocessing
│   ├── activations.py      # Activation functions
│   └── losses.py           # Loss function implementations
│
├── train.py                # Main training script
├── confusion_matrix.py      # Confusion matrix visualization
├── requirements.txt        # Project dependencies
└── README.md               # Project documentation

Training the Model

Standard Training:
```
python train.py
```

Custom Configuration:

python train.py --optimizer adam --learning_rate 0.001 --num_layers 3 --hidden_size 128

Hyperparameter Sweep:
```
python train.py sweep
```
Confusion Matrix Visualization:
```
python confusion_matrix.py
```

Hyperparameter Configuration

The project supports extensive hyperparameter tuning:

Epochs: 5, 10
Hidden Layers: 3, 4, 5
Hidden Layer Size: 32, 64, 128
Weight Decay: 0, 0.0005, 0.5
Learning Rate: 1e-3, 1e-4
Optimizers: SGD, Momentum, Nesterov Accelerated Gradient, RMSprop, Adam, NAdam
Batch Size: 16, 32, 64
Weight Initialization: Random, Xavier
Activation Functions: Sigmoid, Tanh, ReLU

Wandb Integration

The project uses Weights & Biases (Wandb) for:

Experiment tracking
Hyperparameter optimization
Result visualization
Performance comparison

Key Implementations

Neural Network

Flexible architecture
Manual backpropagation
Multiple activation functions

Optimizers

Implemented from scratch
Support for various optimization algorithms

Visualization

Confusion matrix
Performance metrics
Hyperparameter importance

Requirements

The project depends on the following libraries:

Fashion-MNIST Dataset
Weights & Biases (wandb)
NumPy
Matplotlib
Scikit-learn
Pandas
Seaborn
Keras

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
__pycache__		__pycache__
utils		utils
wandb		wandb
README.md		README.md
__init__.py		__init__.py
confusion.py		confusion.py
neural_network.py		neural_network.py
optimizers.py		optimizers.py
sweep_config.yaml		sweep_config.yaml
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Neural Network Implementation for Fashion-MNIST Classification

Features

link:

Project Structure

Training the Model

Hyperparameter Configuration

Wandb Integration

Key Implementations

Neural Network

Optimizers

Visualization

Requirements

About

Releases

Packages

Languages

Parasmukati/DA6401_assignment1

Folders and files

Latest commit

History

Repository files navigation

Neural Network Implementation for Fashion-MNIST Classification

Features

link:

Project Structure

Training the Model

Hyperparameter Configuration

Wandb Integration

Key Implementations

Neural Network

Optimizers

Visualization

Requirements

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages