4 minute read

こんにちは、風音屋(@Kazaneya_PR)にアドバイザーとして関わっております、土川 稔生(@tvtg_24)です。

このたび、翻訳プロジェクトに携わらせていただいた『アジャイルデータモデリング 組織にデータ分析を広めるためのテーブル設計ガイド』の出版に際し、ea さん(@0610Esa)が第一弾として振り返りを書いてくださったので、今回は第二弾として、自分の体験から振り返ってみたいと思います!

自己紹介

私は株式会社タイミーに所属しており、2019 年からタイミーの 1 人目のデータエンジニアとして、データ基盤を 5 年半ほど構築してきました。

タイミーは、「働きたい時間」と「働いてほしい時間」をマッチングするスキマバイトサービスを提供しています。データチームとして、企業(toB)と個人(toC)の双方から寄せられる膨大なデータ、さらにはそのマッチングデータを BigQuery に集約し、日々データ基盤を運用しています。

社内のメンバーが年々倍々で増加する中、データ活用の幅も広がり、データ基盤はそのスケールに合わせて柔軟かつ高性能に設計される必要があります。

そのため、データ分析の正確性と効率性を向上させるために、データモデリングは欠かせない要素となっており、社内のデータニーズや各種データの多様化に合わせ、モデリング手法も常にアップデートしていかねばならない状況です。

『Agile Data Warehouse Design』との出会い

2023 年、タイミー内でデータエンジニア、アナリティクスエンジニア、そしてデータアナリストといった異なる役割のメンバーで、原著『Agile Data Warehouse Design』の輪読会を開催しました。

この輪読会では、データモデリングの重要性や、組織全体でのデータ活用のあり方について、各分野の視点から意見を交わすことができ、共通理解を深める良い機会となりました。

原著の副題である「Collaborative Dimensional Modeling, from Whiteboard to Star Schema」にもある通り、データモデリングはアナリティクスエンジニアだけの領域ではなく、データを利用するすべてのステークホルダーと共に協力(Collabration)しながら構築していくべきものです。そのため、同じ知識や概念を共有するためには、日本語の書籍で共通言語を持つことが大変重要だと改めて実感しました。実際、原著の輪読会では言葉の解釈が難しい部分があり、いくつかの疑問点が解消されず、個人的には「もっと活発な議論ができたら…」という不完全燃焼の気持ちも残りました。

そんな折、輪読会終了後にゆずたそさん(@yuzutas0)から風音屋さんで進めている『Agile Data Warehouse Design』翻訳プロジェクトへのお誘いをいただき、今回のプロジェクトに参画させていただくことになりました。

本の内容紹介

『アジャイルデータモデリング』は、発売から 10 年以上が経過しているにもかかわらず、依然として学ぶべき内容が豊富で、これから実践していきたいアイデアが数多く散りばめられている書籍です。

アジャイルの考え方とデータモデリング

アジャイルの考え方を取り入れた反復的かつ段階的な改善プロセスにより、業務の変化に迅速かつ柔軟に対応できるディメンショナルモデルを構築できます。なお、本書では基本概念から応用までを丁寧に解説しており、ディメンショナルモデリングに不慣れな方でも、実務に直結する知識を身につけることが可能です。

BEAM✲ を用いた実践的なモデリング設計

BEAM✲ フレームワークに則ることで、ヒアリングで得たビジネス要件をスムーズに反映し、データモデリングの設計まで一貫して実施できます。初めて設計に取り組む方でも安心して使えるよう、具体的な事例と共に、手順やチェックポイントが明示されており、すぐ使えるフレームワークになっています。

7W を用いた様々なユースケースへの対応

7W フレームワークは、「誰が」「何を」「いつ」「どこで」「どれくらい」「なぜ」「どのように」の 7 つの視点からユースケースの要件を網羅的に整理・分析する手法です。このアプローチにより、さまざまな業務シーンに最適なデータストーリーを整理でき、効果的なデータモデル設計を実現することができます。

翻訳においての挑戦

今回の翻訳プロジェクトでは、2 つの挑戦があったと振り返っています。

1. 専門用語と未翻訳概念の取り扱い

原著に登場するデータモデリングの専門用語や、これまで日本語に訳されていなかった独自の概念について、翻訳メンバー間で何度も議論を重ねました。原著の意図を忠実に反映しつつ、日本の現場で実際に使いやすい表現を模索することで、誰もが理解しやすい共通の言語としての日本語表現の確立を目指しました。

たとえば、「degenerate dimension」の翻訳では、「縮退ディメンション」や「逆ディメンション」などの候補を検討しましたが、それぞれに少しずつ違和感がありました。何度も Slack や GitHub 上で議論を重ねた結果、「退化ディメンション」という訳語が最も原著の意図を正確に反映し、日本語としても自然であると判断し採用しました。

個人的に、単純に直訳しても日本語として全く聞き馴染みがない言葉が多かった場合は、日本のデータコミュニティや過去のブログ、カンファレンスのスライドなどでの用語の使われ方を調査し、一番自然に受け入れられそうな表現を選定するよう心掛けました。また、どうしても一語では表現しきれない場合には脚注や補足を加えることで読者の理解を助けられるよう意識しました。

2. 読者が直ちに活用できる実践事例の付加

本書を手に取った方々が、すぐにアクションに移れるようにするため、日本でデータモデリングをすでに実践している企業の事例を最後に付録として追加しました。これにより、理論だけでなく、実務に直結するヒントや具体例を提供し、読者にとって現場での活用にすぐに役立つ内容となるよう工夫しました。

謝辞

最後に、この翻訳プロジェクトに携われたこと、そして本書が皆さまの手に届くこととなったのは、多くの協力と支えがあったからこそだと思っています。

まずは、一緒に頑張った翻訳メンバー、プロジェクトに声をかけてくださったゆずたそさん、レビューに参加してくださった皆様、講談社サイエンティフィク横山さん、そして原著の著者である Lawrence Corr さん、Jim Stagnitto さんに心より感謝申し上げます。

本書が皆さまの日々の業務やデータに関する取り組みの一助となれば幸いです。

今後とも、どうぞよろしくお願いいたします。

Tags: , ,

Posted:

Author: tvtg_24

土川稔生(@tvtg_24)。 風音屋アドバイザー。 東京工業大学情報理工学院にて、コンピューターサイエンスを専攻。在学中、AIエンジニアとしての活動を通じて、AIなどのデータ活用を支えるデータパイプライン構築に興味を持ち、2020年4月に株式会社タイミーにデータエンジニアとして入社。DREチームの立ち上げと初期データ基盤の構築を担当し、現在はプロダクトオーナーとしてデータプロダクトの開発に携わっている。株式会社風音屋にアドバイザーとして参画。技術コミュニティdatatech-jp運営。