東京大学医科学研究所様との老化細胞の共同研究のプロジェクトに参加していただきます。
・バイオインフォマティクス(ドライ解析)でホットなシングルセル解析の分野において、今もっとも注目されている研究の1つである「老化細胞」の最先端の研究
・最新の生成AIの基盤モデル(Foundation Model)や様々な機械学習を応用し、且つデータやAIモデルの本質を深く掘り下げて、老化細胞の遺伝子に関するメカニズムを解き明かす研究
また、AI研究開発室ではビジネスの様々なプロジェクトも行っており、共同研究をやりながらもしくはその後に他のプロジェクトに参加して、実績に応じて希望のキャリアを積むことが可能です。
●フィンテック(Fintech)のプロジェクト
同社グループが展開する金融サービスの本質を理解し、数理モデルや機械学習などのデータサイエンス技術を駆使しながら、予測が難しい金融データをうまく扱って収益を改善させます。
●アドテク(Adtech)のプロジェクト
インターネット広告の主な仕組みの一つであるRTB(リアルタイム入札)において、広告出稿する側の費用対効果を最適化するDSP(Demand-Side Platform)の機械学習モデルの設計開発、効果測定などをメインに行います。
●アプリのプロジェクト
フリーWiFi接続を容易にするアプリの新機能や施策の効果測定を因果推論の技術を駆使して行い、データドリブンに経営判断するための仕組みを整えて、サービスのKPIを改善させます。
●その他のプロジェクト
暗号資産取引、不正検知などに関して、データ解析や機械学習の技術を応用して支援します。
【研究開発業務】
・プロジェクト業務を行いながら、一定の時間、全員で最先端の機械学習手法や新たな機械学習の応用を研究します。
・さらに四半期ごとに選任されたメンバーは重点的に研究開発を行います。
【ポジションの魅力】
・生物学の最先端の1つである老化細胞と、最先端のAI技術を駆使する非常にチャレンジングな研究に関わることができ、人類の未知のメカニズム解明に貢献できます
・最先端の機械学習・深層学習・統計手法などを常に学べます
・重要な3つのスキル(課題解決・データサイエンス・エンジニアリング)を身につけ、一つ以上強みを大きく伸ばせます。
・別のプロジェクトを担当する部署のデータサイエンティストと勉強会などで交流する機会も多く、データサイエンススキルを高められます
・グループCTO直轄の部署であり、技術の選定は現場に一任されているため、最先端の技術を自ら検証・導入することができます
・本人の実績と意欲に応じて、チームの重点テーマについて自由に研究開発する業務に挑戦することができます
・また、老化細胞の共同研究以外のプロジェクトに関わる場合は以下の魅力があります。
・同社グループの多岐に渡るサービスについて、データ解析およびAI技術によって様々な課題を解決するプロジェクトをゼロから立ち上げる機会があります
・世界 No.1 規模の金融データや、数百テラバイト規模のアドテクデータなど様々な領域のデータを直接扱うことができ、ビッグデータを解析する技術(BigQuery・PySparkなど)も習得できます
・時系列データ、ユーザー行動データ、記事といった様々な種類のデータを解析することができます
・全て自社サービスのため、事業部と一緒に自ら課題を設定し解決方法を考え、データサイエンスに基づいた改善サイクルを行うことができます
・アカデミックな分野で活躍してきた博士やエンジニア出身者などでチームが構成され、多様性のあるチームです
【利用技術】
●解析手法
シングルセルRNA解析、遺伝子発現解析
機械学習:
Transformer系(大規模言語モデル、シングルセル生成AIモデル他)、グラフニューラルネットワーク(GNN)、多層パーセプトロン(MLP)、アンサンブル学習/勾配ブースティング(Gradient Boost Tree + LR, Random Forest, ExtraTree , Ada Boost, XGBoost, LightGBM)、PCA、FP-Growth、Word2Vec、Doc2Vec、協調フィルタリング、ベイズ推定、HMMモデル(隠れマルコフモデル)
統計分析:
t検定、カイ二乗検定、F検定、二項検定、コルモゴロフ・スミルノフ検定、シャピロウィルク検定、サンプリング(MCMC,ブートストラップ法など)、分散分析、因果推論(差分の差分法など)
●開発技術/環境
プログラミング/フレームワーク
R、Python、PyData(numpy、scipy、pandasなど)、Streamlit
PyTorch、TensorFlow、LangChain、Spark(PySpark)
クラウド/オンプレ(ミドルウェア)
SHIROKANE
GPUワークステーション
Google Cloud(GCS、BigQuery、VertexAI、Dataflowなど)
AWS(S3、Athena、EMR/Serverless、StepFunction、SageMaker、Bedrockなど)
MySQL、MariaDB、Percona Server、PostgreSQL、Galera Cluster、Oracle、Hive、Hadoop/HDFS
ConoHa(GPUサーバー)
大規模言語モデル(LLM)関連
OpenAI API、Llama3、LangChain、HuggingFace
【必須スキル/経験】
以下をすべて満たした方
・機械学習や深層学習の理論に触れる研究の経験がある
・特に深層学習、生成AIの理論の深い知識
・情報系の博士号を取得している
・一通りの機械学習・深層学習の知識がある
・RかPythonが書ける
【歓迎スキル/経験】
・実際にプロダクトもしくは研究で機械学習/深層学習を活用して実績を出した経験がある
【求める人物像】
・手法ありきではなく、ビジネス課題解決のためにあらゆるアプローチを考えて最適なやり方を見出すことが好きな方。
・どんなことにも興味をもち、情熱をもって新しい技術、新しい業務にチャレンジできる方。
・一人では到底できない大きな成果をチームで目指せる方。
・データや結果を鵜呑みにしないで、常にクリティカルシンキングを行える方。
東証プライム上場 老舗光学機器メーカー FPD装置事業部 構想設計エンジニア
東証プライム上場 日系大手コンサルティングファーム コンサルティング本部 シニアコンサルタント
プライム上場 総合商社 IT業務部門 基盤統括担当
人々の生活や命を支えるため、「食料・水・環境」分野で地域に根ざした事業にチャレンジする
オルタナティブ市場成長の担い手として。個が経験を活かし、チームワークで価値を生み出す運用会社です。
大企業から中堅中小企業まで。 サステナビリティの視点で ビジネスの成長ストーリーを描く。
「成長の果実」を従業員の手に。 世界と日本で多くの企業が待ち望む、 新たな報酬制度の運用を支えたい。
世界のスタートアップに投資し、 中長期的な成長に伴走していく。 日本の農林水産業と、食料が育むいのち、 そして地域を元気にするために。
世界No.1の実績を持つM&A総合企業として、地方創生から日本の新たな成長を支え続けたい。未経験者も3年で高い成長実感が得られます。