Ubie のデータ関連職種の紹介
Ubie のデータ関連職種の紹介

Ubie のデータ関連職種の紹介

はじめに

この資料は、Ubie のデータ関連職種にフォーカスして、データ関連職種(データエンジニア、データアナリスト、機械学習エンジニアなど)として働くメンバー自らが作成した採用ページです。

Ubie の事業においてデータの取得・蓄積・活用は非常に重要です。この資料を読むことで、データ関連職で働く面白さをより具体的にイメージしていただけると思います。

1. 事業と会社について

ビジョンとミッション

image

事業

症状検索エンジン「ユビー」(生活者向け)

image

こちら から、どなたでご利用いただけます。是非お試しください。

ユビーメディカルナビ(医療機関様向け)

image

製薬企業様との協業

症状検索エンジン「ユビー」や「ユビーメディカルナビ」といった生活者・医療機関様との接点であるプロダクトに製薬企業様の知見を織り交ぜることで、医療現場、生活者、そして治療のエキスパートたる製薬企業様の三者の適切なマッチングを実現します。

事例としては、以下の記事もご覧ください。

3 つの事業の掛け合わせで、より「適切な医療に案内」できる

上記3つの事業は単独で存在しているものではなく、相互に影響し合うことで、「適切な医療に案内」するための総合的な基盤を構築しています。

image

Ubie の事業とデータの関わり

Ubieのデータ基盤は事業価値の源泉

Ubieのデータは主に以下の3つの領域で活用されています。

  1. ToB,ToC向けサービス改善のためのデータ分析
  2. 保有データおよび機械学習を活用したプロダクト機能開発
  3. ToB,ToCサービスで蓄積したデータを用いた顧客レポーティング

(具体の業務内容については、後段のチーム紹介セクションでご確認ください。)

分析によるサービス改善活動だけでなく、顧客レポーティングのようにデータが顧客価値と密接であることが特徴です。高品質なデータ基盤の構築を通して会社の成長を直接的に牽引できることが、Ubieのデータ系職種の醍醐味とも言えます。

データ品質の重要性

特に「ToB,ToCサービスで蓄積したデータを用いた顧客レポーティング」では、高品質なデータ基盤の構築・運用が求められています。

  • 統計情報だけでなく、一人ひとりのユーザーの行動データ分析が重要。
    • 1件の数値ズレが情報としての価値を大きく毀損する可能性がある。
  • レポート先が社外であり、顧客との信頼関係の構築も求められる。
    • 社内分析での利活用とは異なり、求められる品質水準が極めて高い。

(参考)Ubie保有データを用いたN=1分析事例

image

データ関連職種と組織体制

データエンジニア

Data Platform全般の構築・維持のためのエンジニアリング業務を主に行う職種です。

アナリティクスエンジニア

データ活用の効率性・信頼性の向上につながるエンジニアリング業務を主に行う職種です。

データアナリスト

データ分析に基づくインサイト導出・新規施策提案などの事業推進を主に行う職種です。

機械学習エンジニア

関連病名抽出や質問選定など、データとアルゴリズムを活用した機能開発を行う職種です。

機械学習基盤エンジニア

機械学習システムの基盤構築やプロダクション適用のための開発や運用を行う職種です。

※各職種の詳細につきましては、ページ下部の「募集職種」をご覧ください。

データ関連職種を取り巻く組織・体制

※ 簡素化した図です。実態はもう少しステークホルダーが多いなど、違いがあります。

image

Data and Analytics Platform Team

まず、データエンジニアとアナリティクスエンジニアは、「Data and Analytics Platform」チームとして協同で動いています。アナリティクスエンジニアは、実際には各プロダクトチームの中に入り込んで仕事を進めることも多いです。

Data and Analytics Platformとしてシステムや情報の管理を集約しつつ、データ利活用やデータプラットフォームの様々なステークホルダーと協同して仕事を進めています。

AI Team

機械学習エンジニア、機械学習基盤エンジニアは、「AI Team」として活動しています。医師も密に協同し、関連病名提示システムや医療情報抽出システムを開発しています。

2. Data and Analytics Platform Team について

チームのミッション

Ubieのすべてのチームが適切なデータ利活用を自律的に推進できるように、「Ubieの持つデータを安全かつ効率的に収集・蓄積・活用する基盤と仕組みをつくる」ことを目的に活動しているチームです。

チームは主にデータエンジニア、アナリティクスエンジニア、データアナリストで構成されています。全社に関わる重要なデータ分析の基盤構築を本チームが推進するのはもちろんのこと、個々のwill/canをもとに各事業やプロダクトのチームに入り込んで業務を行うこともあれば、各事業内に専用のチーム自体を立ち上げ活動することも行っています。

現在の Data Platform アーキテクチャ

現在のデータプラットフォームは、概ね以下2つの部分にわかれています。

  • データ投入部分:ソースデータをBigQueryで構成されたデータレイクへ投入する部分
  • データ利活用部分:投入されたデータの権限管理をしたり、データマートを作成したりする部分

データ投入部分アーキテクチャ図

image

  • Streaming pipeline では、アプリケーションから発生するログを、Dataflow を介して BigQuery に Streaming Insert しています。
  • Extract & Load pipeline では、アプリのデータやSaaSのデータを BigQuery に日時で投入しています。
  • ツール類は基本的には Python で書かれています。

データ利活用部分アーキテクチャ図

image

  • DataLake(restricted) には基本的にアクセス権がありません。データやユーザーによって付与できるアクセス権や利用範囲は変わるため、それに応じてアクセス権を与えたソーステーブルを作り、そこからデータマートを作っています。
  • ユーザーはdbtを使ってマートを開発したり、BI tool や BigQuery を直接利用して、データ分析等をしています。
  • ここには書ききれていませんが、アプリケーションに戻しているデータもあります。

普段の業務

チームとしては、データエンジニア、アナリティクスエンジニア、データアナリストが共通の会議体を持ち、情報交換や悩みの解決をしていきます。

また、アナリティクスエンジニアとデータアナリストで行う業務を明確に区別しておらず、個々のキャリアにおけるwillやこれまでの経験に基づくcanをベースにリソースアロケーションを行っています。

データ品質および再現性の高いデータパイプライン開発・運用

  • Ubieでは事業の性質上、収集するデータ自体がコアであり、データ信頼性向上にとても力をいれています。統計情報を扱うというより、一人ひとりのユーザ行動データを正確に扱うことが極めて重要なためです。
  • そのため、dbtを利用したUbie独自のデータモデリングやデータのテストにより、データ品質および再現性高いデータパイプライン開発・運用を日々行っています。
  • 利活用しやすく信頼性の高いデータ自体が生まれることを重要視しており、各プロダクトチームのSWEと連携した信頼性の高いデータ開発を推進しています。

定性・定量側面からのプロダクト課題の解決のためのデータ分析

(主にデータアナリスト、アナリティクスエンジニア)

  • 1400を超える医療機関に導入されているユビーAI問診や月間700万ユーザを抱える症状検索エンジンユビーのデータ分析を様々な課題に対して行います。データアナリストが解くべき問いを設定するところから関わります。各プロダクトチームが自律的に分析できるように、データマートおよびダッシュボードの構築も行います。
  • 年間200人のtoC利用ユーザのインタビューに参加したり、インタビューで得た情報をもとにした定量分析を行います。定性・定量のデータを組み合わせることで、インサイト抽出することが期待されます。
  • toBプロダクトを導入している医療機関に訪問して、利用状況の観察やオペレーション業務にも参加できます。現場を知り、肌で体験することを会社として重要視しています。

📔
関連資料

今後やっていきたいこと

BI民主化によるデータ利活用の精度と速度最大化

事業が急速にスケールし、必要なレポーティングやデータ分析の量や質が増大しています。さらに、アナリティクスエンジニアやデータアナリストに期待される役割もどんどん広がっています。

事業のスケールに対応できるように、データアナリストやアナリティクスエンジニアなしで、各チームが得たいデータを得るまでの精度と速度が高い状態にし「だれでも滑らかにデータ利活用できるようにする」を最重要課題として取り組んでいます。

そのためのHowとして、利便性の高いデータマートの再構築や新しいダッシュボードの構築もあれば、データが必要なユースケース整理から運用フローの構築も行います。全社として広い視野で解くべき問を設定することが求められます。

きめ細やかなデータSLOの管理を可能にするデータ基盤の拡張

Ubieの事業において、様々なデータが様々な経路から流入し、それらが様々な用途で利用されます。中には非常に高いレベルのデータ品質を求められるものもありますし、そうでないものもあります。

こうした多岐に渡るデータの利活用のシーンに応じて、必要なデータ品質(SLO)の管理が簡単に実現できる基盤としてくことで、生産性と信頼性のさらなる向上を狙います。

その他、利用している技術スタックの刷新

Modern data stackやGenerative AIの隆盛を見てわかるように、データを取り巻く技術は日々進化し続けています。こうして変化を見極め、Ubieのデータプラットフォーム発展に資するものは積極的に適用していきたいと考えています。

3. AI Team について

チームのミッション

Ubieのデータと機械学習アルゴリズムや数理モデルを組み合わせ、事業・プロダクトで利用される様々なシステムを開発・運用することを目的に活動しているチームです。

チームには機械学習エンジニア・機械学習基盤エンジニアに加えてドメインエキスパートである医師が在籍し、各々の専門領域を活かしながら、関連病名提示システムや医療情報抽出システムの開発・運用に協力して取り組んでいます。

普段の業務

チームで開発・運用している関連病名提示システムは、マイクロサービスとしてAPIを提供しており、症状検索エンジン「ユビー」とユビーメディカルナビの双方で使われています。

機械学習エンジニアは、これらのシステムで使われるアルゴリズムの改善や、Pythonアプリケーションの開発を担っています。

機械学習基盤エンジニアは、これらのシステムの運用環境の整備や、システムが利用するデータを加工するデータパイプラインの構築、CI/CD環境の整備などを担っています。

AI team に在籍する医師は、システムが利用する医学データの整備を担うほか、プロダクトオーナーやドメインエキスパートとして、チームが解決する課題の特定や医学的な監修を行います。

これらのメンバーがひとつのスクラムチームとして活動しているのが特徴です。

問診アルゴリズムの開発

患者の症状に応じて、数千の問診候補(質問)から最適な質問を選定する問診アルゴリズムの開発

具体例

  • 症状・疾患検索アルゴリズムの改善
  • 評価データの設計と収集
  • 実臨床データに基づく改善
  • 逐次的な疾患確率分布の推定
  • 機械学習を用いた質問応答予測
  • 質問選定理由の解釈性向上
  • 本番環境で使用する API の実装と運用

image

関連病名提示アルゴリズムの開発

問診データから関連性の高い疾患を提示し、医師の理解や患者の行動変容を支援する、汎用性・解釈性の高いアルゴリズムを開発

具体例

  • 評価データの設計と収集
  • 実臨床データに基づく改善
  • 候補疾患の効率的な絞り込みの実現
  • 疾患と関連のある症状を整理・活用
  • 複雑な症状の組み合わせを考慮
  • 判断の根拠を示す情報を提供
  • 安全なリリースを行なうためのリリース前シミュレーションの開発
  • 本番環境で使用する API の実装と運用

① 患者への事前問診を医師に共有

image

② Ubieの提示病名と実臨床で医師が疑った病名を照合 ③ アルゴリズム改善

医学データ構築の支援・整備

様々なデータソースからデータを取得・整備し、サービスで扱うのに適した医学データを構築しています。

image

今後やっていきたいこと

関連病名提示システムの高度化

Ubie のもつ豊富なデータを活用し、コンテキスト情報などを利用可能なアルゴリズムを開発することで、システムの出力結果とその解釈性の改善が可能であると考えています。こうした活動を起点として、生活者・医療機関様の課題解決に貢献できるようなプロダクトづくりに取り組んでいきます。

Human-in-the-Loop MLOps の考え方を取り入れた開発生産性向上

症状検索エンジン「ユビー」をはじめとするプロダクトから得られるデータをもとに、医師が医学データを日々整備することで、 Ubie の関連病名提示システムは継続的に改善されています。このような活動を支えるため、AI team では医学データの管理システムやシミュレータの開発を行っています。こうしたシステムを発展させることで、エンジニアと医師の開発生産性向上に取り組みたいと考えています。

Generative AI などの新技術活用の模索

チームではこれまで、お薬手帳や紹介状などの紙の書類をデータ化し、構造化された情報を取り出すシステムを開発してきました。近年急速に発達している Generative AI などのAI技術を活用して、こうしたシステムのさらなる機能・性能の向上に取り組み、医療現場のDXと負担削減に貢献したいと考えています。

4. 採用について

採用フロー

Ubie では、異なる観点による面接を複数回行っています。回数は概ね3回です。

詳しくは以下を御覧ください。

募集職種

現在オープンしているデータ関連職種は以下のとおりです。

5. メンバー

機械学習エンジニア

望月 駿一      @smochi_pub

image

自己紹介: 事業会社でデータ分析業務を経て、Ubie に入社。データを使って事業価値を生む仕事が好き。

入社理由: 「全ての人々を最適な医療に案内する」というミッションに大きさと普遍性があり、Ubie のアプローチにデータやアルゴリズムが果たす役割がクリティカルだと感じたためです。

風間 正弘      @masa_kazama / 入社エントリ

image

自己紹介: 複数の企業で推薦システムを開発。データ×アルゴリズム×ビジネスで、新しい価値を生み出したい。

入社理由: データ×アルゴリズムを軸として、医療業界をより良くできる事業の可能性を大きく感じ、入社しました。また、社員みんなが面白そうだったのも理由の一つです。

菊田 遥平      @yohei_kikuta / 入社エントリ

image

自己紹介: 価値のある医学的なデータを集めて人類の知的財産を生み出したい。数理的な議論とクソリプが好き。博士(理学)

入社理由: 風間さんから Ubie の話を聞き、価値あるデータと巨大な事業ポテンシャルと有益なサービスとが兼ね備わってることに感銘を受け、ここなら無職を辞めてもいいと思い入社しました。

奥田 裕樹      @yag_ays / 入社エントリ

image

自己紹介: 自然言語処理や機械学習を中心に、人の役に立つ技術や情報を発信していきたい。愛犬はコーギー。

入社理由: 親族に医師がいるため、医療に対する関心は常にありました。そんな中で新卒時代の同期に誘われたのをきっかけに、事業価値やUbie社員たちのレベルの高さに惹かれて入社しました。

伊藤 敬彦      @takahi_i / 入社エントリ

image

自己紹介: 自然言語を処理するプログラムを書くのが好き。仕事では ML や検索機能に関わることが多い。博士(工学)

入社理由: 事情によりフルリモート環境で働く必要が出てきて転職を考えました。転職活動の中で菊田さんから Ubie が展開する事業を解説してもらい、その内容に惹かれて入社しました。

太田 満久      @ohtaman / 入社エントリ

image

自己紹介: データ活用を医療業界に浸透させたい。人と人をつなぐのが好きで、技術コミュニティ運営などもやっている。博士(理学)

入社理由: Ubie のミッションと医師でもある代表の阿部の想いの強さ、開発メンバーの濃さに惹かれ、ここで一緒に大きな目標を追いかけたいと思い、入社を決意しました。

山田 訓平      @ymdpharm / 入社エントリ

image

自己紹介: 事業と組織のフェーズにバチッとハマる ML システムをデザインしたい。統計学とバックエンド開発が好き。父。

入社理由: メンバーの自律性を保つためのカルチャーが導入されていることと、事業がスケールするフェーズであることが魅力でした。どんな仕事ができるだろうとワクワクして入社しました。

西林 孝          @hagino3000

image

自己紹介: データを元に意思決定をしていくシステムの開発が好き。人々にとってより良い意思決定とは何かを追い求めていきたい。

入社理由: ミッションへの共感。個性的なメンバーと社会にインパクトを与えるプロダクトに関われること。前衛的な組織開発やカルチャーから普通でない会社の匂いがしたので入社を決めました。

機械学習基盤エンジニア

田中 祥太郎       @yubessy

image

自己紹介: 求人系の事業会社でデータ基盤/ML基盤の開発・運用を経験。データとアルゴリズムの価値をプロダクトに還元する仕事が好き。

入社理由: データサイエンスと医学ドメインのプロフェッショナルが多数在籍する環境に魅力を感じ、困っている人を助けられるプロダクトをこのメンバーと一緒に作りたいと思い入社しました。

医師

五十嵐 健史

image

自己紹介: 内科・麻酔科の非常勤医師。単なる丸暗記がとても苦手なので、理屈を理解しながら医療に携わっていきたい。

入社理由: 東大医学部時代に同期であった阿部に誘われ、医療分野以外の知識は皆無ではありましたが、AIの可能性を感じて思い切って入社しました。

金沢 誠司      @KanapyUbie

image

自己紹介: 産婦人科医師。医師や生活者が必然的に使用するようになるプロダクトを最速で開発するためにここにいます。

入社理由: 正しい情報に辿り着けない/受診が遅れる患者を一人でも減らすためにアプリ開発に着手しようとしていたが、Ubieにジョインした方が理想の世界を早く実現できると考えたからです。

山﨑龍一

image

自己紹介: 精神科医師。テクノロジー×医療をテーマに精神科領域の新規治療開発等にも従事。医療を少しでも前に進めたい。

入社理由: AIが目まぐるしい速さで進化している中、「テクノロジーで人々を適切な医療に案内する」というミッションをUbieのプロダクトなら達成できるのではないかと感じ、入社しました。 

データエンジニア

渥美 達也      @__Attsun__ / 入社エントリ

image

自己紹介: 事業会社での VPoE を経て Ubie に入社。データを使って社会の役に立つ事業を生み出していきたい。

入社理由: ミッションへの共感。データこそが事業価値の源泉になっているため、データという側面から面白い挑戦をしつつ社会にも良いインパクトを与えられると思ったからです。

三原 秀司      @Schumi543

image

自己紹介: アドテク会社の Data Mining Engineer を経て、Ubie に入社。データを使ったプロダクト改善全般が好き。

入社理由: 勉強会で Ubie メンバーと知り合ってから何人かと話をして、このメンバーとなら医療の常識を変えるプロダクト・プラットフォームを楽しく作っていけそうだなと感じて入社しました。

石川 有

image

自己紹介: ベイエリアの企業で Data Engineering, ML, MLOps の Tech Lead を経て Ubie に入社。

入社理由: 日本の医療体験がアメリカに比べて個人的に悪いと感じ、データや ML に関する自分の経験を活用することで社会に貢献できると思ったからです。

由川 竣也

image

自己紹介: 事業会社でのSWE, Data Engineerを経てUbieへ入社。ラーニングアニマルとして事業の成長を支援/牽引していきたい。

入社理由: 医療への貢献という社会的意義の大きさと、Ubieの持つポテンシャルに惹かれました。そしてデータが事業の成長や価値提供に直結すると感じ、それが決め手となり入社しました。

データアナリスト / アナリティクスエンジニア

酒井 直人     @jagabass / 入社エントリ

image

自己紹介: 事業会社の分析チームリーダーを経て Ubie に入社。データ分析に限らず意思決定サポート全般が好き。

入社理由: 素の自分をありのままに出せそうなカルチャーであることや、過去の医療体験から熱意を持って取り組める事業内容であると感じたことが主な理由です。

大木 基至    @okiyuki99 / 入社エントリ

image

自己紹介: 社会へインパクトを与え、データが価値となるプロダクト開発がしたい。2児の父。博士(工学)

入社理由: 育児を通じて医療における複数のペインを体験しました。Ubie のミッションに強く共感し、データが事業のコアとなる最重要価値であることに惹かれ、入社を決意しました。

戸川 和樹 入社エントリ

image

自己紹介: 医療×ITの会社でのデータサイエンティスト等を経てUbieに入社。医療業界の持つ複雑さと社会的意義を愛してやまない。

入社理由: いち生活者としてユビーのプロダクトが素晴らしいと思ったこと。カルチャーガイドに記載してあることが自分にマッチしすぎていると感じたこと。

松島 龍司 入社エントリ

image

自己紹介: 好奇心からデータサイエンスを独学し、事業会社にてヘルスケアデータの分析業務に従事。知らない事を学ぶのが好き。

入社理由: ユビーのプロダクトに魅力を感じたため。個人としても利用価値を感じるプロダクトの改善に関わりたいと思い、入社しました。

河合 康平 入社エントリ

image

自己紹介: 事業会社で社内のデータ分析コンサル業務等を経てUbieに入社。医療/インフラなど広く世の中に関わる問題に貢献したい。

入社理由: Ubieの目指す世界への共感。魅力的なカルチャーとメンバーが集まっていて、Ubieなら医療という身近な問題をデータの力で改善できると感じたため入社を決めました。

Appendix

参考リンク