Skip to content

Latest commit

 

History

History
54 lines (36 loc) · 4.58 KB

日本語README.md

File metadata and controls

54 lines (36 loc) · 4.58 KB

スーパーレゾリューションGAN(SRGAN)プロジェクト

はじめに

このプロジェクトでは、革新的な研究に基づき、スーパーレゾリューション生成敵対ネットワーク(SRGAN)を利用して画像品質を向上させます。私たちのウェブプラットフォームを通じて、ユーザーはFlask駆動のインターフェースとバックエンドサービスにより、簡単に画像をアップスケールすることができます。

モデル開発

研究論文

私たちのSRGANモデルの基礎は、スーパーレゾリューションに新しいアプローチを提供した評価の高い論文です。

トレーニングデータ

トレーニングには「mirflickr」データセットを使用し、最初は12,500枚の画像から始め、その後、より包括的な学習のためにさらに12,500枚の画像を組み込みました。

トレーニングプロセス

トレーニングは当初3日間にわたって9エポックで実行され、拡張されたデータセットを使用した二次フェーズにより、パフォーマンスが向上し、PSNR値が高くなりました。

結果

拡張されたデータセットでのトレーニングを経て、PSNRは29.35に達し、モデルの向上したスーパーレゾリューション能力を証明しました。 こちらがノートブックのリポジトリです。

Flaskを使用したウェブサイトとAPIインターフェース

ホスティングのためのFlask

私たちはそのシンプルさと効率の良さからFlaskをウェブアプリケーションのサーバーとして選びました。Flaskはスケールに応じて複数のリクエストを処理する能力があるため、プラットフォームのフロントエンドとバックエンドの両方をホストするのに理想的です。

APIコールのためのFlask

Flaskは、画像アップロードと処理APIコールを扱うRESTful APIも動力としています。このAPIはGoogle Cloud Platform(GCP)にホストされているSRGANモデルと対話し、スーパーレゾリューションタスクを実行します。

データアップロードと処理

ユーザーはウェブインターフェースを通じて画像をアップロードでき、その画像はFlask APIに送信されます。APIはこれらのリクエストを効率的に管理し、画像をSRGANモデルにアップスケーリングのために転送し、その後、高解像度の画像をユーザーに返します。

Google Cloud Platform(GCP)ホスティング

私たちのモデルはGCPにホストされており、信頼性の高いモデル推論を確保するためにその堅牢でスケーラブルなコンピューティングリソースを利用しています。

結果とウェブサイトインターフェース

ウェブサイトのスクリーンショット

ホームページのスクリーンショット こちらはユーザーが画像アップスケーリングの旅を始めるホームページです。

結果のスクリーンショット 結果ページでは、オリジナルの画像とスーパーレゾリューションされた画像を比較表示し、モデルの能力を明確に示しています。

将来の作業

私たちはモデルを洗練させ、改善し続けることを目指しています。さらなるトレーニングと最適化の計画があり、結果の品質をさらに向上させる予定です。モデルはまだ若く、多くの磨きが必要です。

使用方法

非常に簡単です。64 x 64ピクセルの画像をアップロードすると、モデルが画像を強化し、256 x 256ピクセルにスケールアップします。

貢献

コミュニティからの貢献を歓迎します。機能の拡張、バグの修正、コードの改善など、皆さんの意見を大切にしています。

ライセンス

このプロジェクトは、MITライセンスの下で利用可能です。