メインコンテンツまでスキップ

表 英輝 | HIDEAKI Omote

岐阜大学大学院 自然科学技術研究科 知能理工学専攻 加藤研究室 修士1年生

 メール :omote.hideaki.s8@s.gifu-u.ac.jp

経歴 | History

  • 2019年4月 岐阜大学 工学部 電気電子・情報工学科 入学
  • 2024年3月 岐阜大学 工学部 電気電子・情報工学科 卒業
  • 2024年4月 岐阜大学 自然科学技術研究科 知能理工学専攻 入学

ニュース一覧 | News

2024-11-12 : 国内学会ViEW2024にインターンシップの研究成果が採択(12/6 IS4-5)

国内学会ViEW2024に 8/1から9/30まで参加したSB Intuitions株式会社のインターンシップの研究成果が採択されました。
「⽂書画像理解性能向上に向けた視覚⾔語モデル構築⽅法の検討」というタイトルで12/6にIS4-5で発表予定です。
内容は文書画像理解を下流タスクとして、性能を発揮できるVLMのモデル構造や学習方法の比較実験を行いました。

2024-08-06 : SB Intuitions株式会社のインターンシップに参加 (2024年8月1日~2024年9月30日)

8/1からSB Intuitions株式会社のインターンシップに参加させていただいております。
9/30までの約2ヶ月間、マルチモーダル基盤モデル、特にビジョン&ランゲージモデル(VLM)に関して研究開発を行う予定です。

2024-07-12 : X(旧Twitter)の運用を開始しました。

X(旧Twitter)アカウント作成以来運用していませんでしたが、夏季インターンシップに合わせて運用開始したいと思います。
アカウント:@hideaki_o

2024-05-16 : 投稿した論文がSSII2024に採択 & 【スポットライト発表】に選定されました。

卒業研究の研究成果を投稿したSSII2024に採択&【スポットライト発表】(口頭発表)に選定されました。また、【インタラクティブセッション】では対面でポスターを交えで研究紹介を行う予定です。(SSII20242日目 6月13日 SO2-06・IS2-06)
第30回画像センシングシンポジウム(SSII2024)

2024-03-25 : 学業成績優秀者として表彰されました。

【表彰】学業成績優秀者表彰式を挙行(令和6年3月25日)
卒業研究を含む学部4年生時代の学業成績を評価され表彰されました。

2024-02-21 : 共同通信社で「低価格コンピュータで学習&推論可能なAI基盤モデルを開発」が紹介されました。

共著論文"Constructing Lightweight Large Vision-Language Model: A Target Approach to Downstream Tasks"が「低価格コンピュータで学習&推論可能なAI基盤モデルを開発」として共同通信社様に紹介されました。
私は主に複数GPUでの高効率なマルチタスク学習(複数タスク・データセットでモデルを訓練する)方法の構築を担当しました。

2024-02-21 : 岐阜大学の「低価格コンピュータで学習&推論可能なAI基盤モデルを開発」で紹介されました。

共著論文"Constructing Lightweight Large Vision-Language Model: A Target Approach to Downstream Tasks"が「低価格コンピュータで学習&推論可能なAI基盤モデルを開発」として岐阜大学公式サイトで紹介されました。
私は主に複数GPUでの高効率なマルチタスク学習(複数タスク・データセットでモデルを訓練する)方法の構築を担当しました。

スキル | Skills

Python & PyTorch

インターンシップ参加 | Internship

  • SB Intuitions株式会社

    期間: 2024年8月1日~2024年9月30日
    実施テーマ: 「高解像度文書画像理解に向けたVLM(画像と言語を理解できるAIモデル)の構築・研究開発」
    URL: https://x.com/sbintuitions/status/1859869504240746794
    実施内容: 文書画像に関して認識応答できるAIモデルは需要があり、これは画像を認識し言語で応答できるVLM(Vision and Language Model)で実現可能です。 そのため、文書画像理解に有用なVLMの構築方法を比較検討しました。 具体的には、VLMの画像エンコーダーとしてViTとCNNの異なるアーキテクチャを採用した場合の比較、 画像エンコーダーへの入力解像度を上げての比較、画像エンコーダーのパラメータ更新の有無の比較などを行いました。 研究成果は国内学会のViEW2024に投稿し発表予定です。
    使用スキル: PythonとPyTorchを用いたVLMモデルのコーディング、Slurmを使用したVLMの分散並列学習、GiT・GitHubを使用した複数人でのコード開発・管理

制作物 | Products