仕事詳細
データサイエンスグループでは、以下の業務を担当しています。
①法人顧客のDX内製化プロジェクト支援
②社内データ活用支援
③データサイエンス応用
データサイエンティストポジションの方には、主に上記①および②もしくは③、または①〜③の全領域に関連した業務に取り組んでいただきます。
※ 直近での業務比重は① : ② or ③ = 7 : 3 程度
具体的には、以下のような業務をお任せします。
※ 実際にアサインする業務は、本人の専門性と目指すキャリアを加味して応相談
①法人顧客のDX内製化プロジェクト支援
顧客のプロジェクトメンバーと伴走・先導する形で、アジリティ高く、かつ柔軟に支援を行う。
具体的な支援内容として以下のようなものがある
・機械学習モデル構築
・構築したモデルのWebアプリ化
・Webフレームワークを利用したアプリのプロトタイプ開発
・推論API構築
・プロジェクトの進め方に関する顧客との折衝
・顧客担当者のコーディング支援(ペアプログラミング、コードレビューなど)
・研修や顧客内部向けのセミナー登壇
扱うデータの種類としては、テーブルデータと画像データがメイン
ただし、顧客の課題に応じて、時系列データや自然言語なども対応可能性あり
②社内データ活用支援
・社内のデータ分析基盤の開発、運用
・サービス利用状況、営業情報、その他各種KPIなどに関するダッシュボード作成
・サービスの品質向上、受講者の学習支援、事業戦略策定などのためのデータ分析
・データの民主化推進受講者の学習支援、事業戦略策定などのためのデータ分析
・データの民主化推進
③データサイエンス応用
・1 dayデータ分析コンペティションの企画、運営
・研究開発、先端技術の社内実装
・機械学習関連の論文サーベイ&要約
・自社データを題材にした大学との共同研究
・LLMを用いた受講者からの質問応答自動化
◆開発環境
GitHub Copilotの利用料を会社が負担
◆計算資源
・MacBook Pro(メモリ32GB〜)貸与
・その他: 共用GPUワークステーション (NVIDIA RTX A6000 2枚搭載), AWS/GCP/Azureのクラウドリソース
◆クラウドインフラ
①法人顧客のDX内製化プロジェクト支援:AWS, GCP, Azure(顧客の環境に応じて変動)
②データ活用による社内支援
③データサイエンス応用:メインはGCP、場合によってAWS
◆データベース・データウェアハウス
①法人顧客のDX内製化プロジェクト支援:RDB(PostgreSQL, Microsoft SQL Server など)、NoSQL DB(DynamoDB, MongoDB など)を顧客の環境に応じて使い分け
②データ活用による社内支援
③データサイエンス応用:BigQuery, MongoDB Atlas, Firestore
◆使用言語
Python (3系), SQL, ShellScript など
◆ツール
・開発系:Git (GitHub), Docker, GitHub Actions, Dataform, Google Looker Studio, Tableau, GitHub Copilot, ChatGPT など
・ドキュメンテーション・タスク管理:Google Workspace, Notion
・コミュニケーション:Slack, Teams
◆Pythonでの使用ライブラリ例
・機械学習全般:pandas, NumPy, scikit-learn, LightGBM, Optuna
・Deep Learningフレームワーク:PyTorch, Tensorflow
・NLP系:Transformers (Hugging Face), OpenAI, Gensim
・画像系:OpenCV, MMDetection, Albumentations
・Webフレームワーク:Streamlit, Dash, FastAPI, OpenAPI