このプロジェクトでは、革新的な研究に基づき、スーパーレゾリューション生成敵対ネットワーク(SRGAN)を利用して画像品質を向上させます。私たちのウェブプラットフォームを通じて、ユーザーはFlask駆動のインターフェースとバックエンドサービスにより、簡単に画像をアップスケールすることができます。
私たちのSRGANモデルの基礎は、スーパーレゾリューションに新しいアプローチを提供した評価の高い論文です。
トレーニングには「mirflickr」データセットを使用し、最初は12,500枚の画像から始め、その後、より包括的な学習のためにさらに12,500枚の画像を組み込みました。
トレーニングは当初3日間にわたって9エポックで実行され、拡張されたデータセットを使用した二次フェーズにより、パフォーマンスが向上し、PSNR値が高くなりました。
拡張されたデータセットでのトレーニングを経て、PSNRは29.35に達し、モデルの向上したスーパーレゾリューション能力を証明しました。 こちらがノートブックのリポジトリです。
私たちはそのシンプルさと効率の良さからFlaskをウェブアプリケーションのサーバーとして選びました。Flaskはスケールに応じて複数のリクエストを処理する能力があるため、プラットフォームのフロントエンドとバックエンドの両方をホストするのに理想的です。
Flaskは、画像アップロードと処理APIコールを扱うRESTful APIも動力としています。このAPIはGoogle Cloud Platform(GCP)にホストされているSRGANモデルと対話し、スーパーレゾリューションタスクを実行します。
ユーザーはウェブインターフェースを通じて画像をアップロードでき、その画像はFlask APIに送信されます。APIはこれらのリクエストを効率的に管理し、画像をSRGANモデルにアップスケーリングのために転送し、その後、高解像度の画像をユーザーに返します。
私たちのモデルはGCPにホストされており、信頼性の高いモデル推論を確保するためにその堅牢でスケーラブルなコンピューティングリソースを利用しています。
こちらはユーザーが画像アップスケーリングの旅を始めるホームページです。
結果ページでは、オリジナルの画像とスーパーレゾリューションされた画像を比較表示し、モデルの能力を明確に示しています。
私たちはモデルを洗練させ、改善し続けることを目指しています。さらなるトレーニングと最適化の計画があり、結果の品質をさらに向上させる予定です。モデルはまだ若く、多くの磨きが必要です。
非常に簡単です。64 x 64ピクセルの画像をアップロードすると、モデルが画像を強化し、256 x 256ピクセルにスケールアップします。
コミュニティからの貢献を歓迎します。機能の拡張、バグの修正、コードの改善など、皆さんの意見を大切にしています。
このプロジェクトは、MITライセンスの下で利用可能です。