RESUMY JOBS
正社員更新: 2026/04/07

【東大松尾研発AIベンチャー】AI/MLエンジニア(Vision Language Model・動画認識)

株式会社Ollo 東京 700万円~1000万円(月給 58万円〜83万円)

年収

700万円~1000万円(月給 58万円〜83万円)

月給 58万円〜83万円

職種

AIエンジニア・データサイエンティスト

ITエンジニア

業界

その他IT・Webサービス

募集人数

2名

仕事内容

【募集背景】 当社のコア技術である動画認識AIは、世界中の製造現場で日々膨大な作業映像を解析しています。このポジションでは、動画認識モデル(Vision Language Model、VLM)の開発・改善を中心に担っていただきます。 具体的には、以下のような方向でモデルを進化させていきます。 モデルの精度や実行スピードの向上 動画を対象としたRAG(Video RAG)による現場ナレッジの検索・活用 エッジデバイス上での大規模モデルの実行 製造ラインでのリアルタイム推論 研究と実装の両面で取り組むべきテーマが多く、中心メンバーとして関わっていただけるポジションです。 【業務内容】 ・製造現場の作業動画を解析するVision Language Modelの研究開発・改善 ・行動認識・姿勢推定・物体検出など、Computer Vision領域のモデル設計・学習・評価 ・多様な現場環境(照明・カメラ角度・作業内容)に対応するロバスト性の向上 ・エッジデバイス上での大規模モデルの最適化・デプロイ ・製造ラインにおけるリアルタイム推論パイプラインの構築 ・モデルの量子化・蒸留・プルーニングによる軽量化 【開発環境】 ・Webフロントエンド: TypeScript, Vue, Nuxt.js ・バックエンド: Go, GraphQL, Python(FastAPI) ・デザイン: figma ・データベース: MySQL ・コミュニケーションツール: Slack ・ドキュメント管理: Notion ・コード管理: GitHub ・laC: Terraform ・インフラ: AWS ・IDE: vscode ・CI/CD: GitHub Actions ・コーディング支援: Github Copilot

応募要件

以下のいずれか、または複数の実務経験(1年以上)もしくはそれに準ずる研究実績 ・動画・画像認識(物体検出、行動認識、セグメンテーション等) ・VLM / マルチモーダルモデル(Vision-Language系モデルの学習・活用) ・LLM(ファインチューニング、RAG、プロンプトエンジニアリング等) ・Python を用いたソフトウェア開発経験(1年以上) ・Deep Learningフレームワーク(PyTorch 等)の実践的な利用経験

求人詳細

月給58万円〜83万円
職種分類ITエンジニア・PM > ITエンジニア
関連職種その他ITエンジニア関連職
関連業界IT×バックオフィス
掲載開始日2026/04/07
最終更新日2026/04/07

似た求人をもっと探す

ITエンジニア・PM」カテゴリの求人をチェック

株式会社Olloの他の求人

関連する求人