正社員更新: 2026/06/15

【東大松尾研発AIベンチャー】AI/MLエンジニア（Vision Language Model・動画認識）

株式会社Ollo 東京 700万円～1000万円（月給 58万円〜83万円）

年収

700万円～1000万円（月給 58万円〜83万円）

月給 58万円〜83万円

職種

AIエンジニア・データサイエンティスト

ITエンジニア

業界

その他IT・Webサービス

募集人数

2名

仕事内容

【募集背景】当社のコア技術である動画認識AIは、世界中の製造現場で日々膨大な作業映像を解析しています。このポジションでは、動画認識モデル（Vision Language Model、VLM）の開発・改善を中心に担っていただきます。具体的には、以下のような方向でモデルを進化させていきます。モデルの精度や実行スピードの向上動画を対象としたRAG（Video RAG）による現場ナレッジの検索・活用エッジデバイス上での大規模モデルの実行製造ラインでのリアルタイム推論研究と実装の両面で取り組むべきテーマが多く、中心メンバーとして関わっていただけるポジションです。【業務内容】・製造現場の作業動画を解析するVision Language Modelの研究開発・改善・行動認識・姿勢推定・物体検出など、Computer Vision領域のモデル設計・学習・評価・多様な現場環境（照明・カメラ角度・作業内容）に対応するロバスト性の向上・エッジデバイス上での大規模モデルの最適化・デプロイ・製造ラインにおけるリアルタイム推論パイプラインの構築・モデルの量子化・蒸留・プルーニングによる軽量化【開発環境】・Webフロントエンド: TypeScript, Vue, Nuxt.js ・バックエンド: Go, GraphQL, Python(FastAPI) ・デザイン: figma ・データベース: MySQL ・コミュニケーションツール: Slack ・ドキュメント管理: Notion ・コード管理: GitHub ・laC: Terraform ・インフラ: AWS ・IDE: vscode ・CI/CD: GitHub Actions ・コーディング支援: Github Copilot

応募要件

以下のいずれか、または複数の実務経験（1年以上）もしくはそれに準ずる研究実績・動画・画像認識（物体検出、行動認識、セグメンテーション等）・VLM / マルチモーダルモデル（Vision-Language系モデルの学習・活用）・LLM（ファインチューニング、RAG、プロンプトエンジニアリング等）・Python を用いたソフトウェア開発経験（1年以上）・Deep Learningフレームワーク（PyTorch 等）の実践的な利用経験

求人詳細

月給	58万円〜83万円
職種分類	ITエンジニア・PM > ITエンジニア
関連職種	その他ITエンジニア関連職
関連業界	IT×バックオフィス
掲載開始日	2026/06/15
最終更新日	2026/06/15