図解入門 最新 データサイエンスがよ~くわかる本

データサイエンス概要をまずは知ろう

技術書を使っての学習は挫折してしまう方が多いですが、こちらは内容の難易度も分量も程よく、効率よくデータサイエンスの全体像を学ぶことができます。ITに関わる方には必携の、初心者の方にもおすすめできる1冊です。

高木章光 (著), 鈴木英太 (著)
出版社: 秀和システム (2019/1/23)、出典:出版社HP

はじめに

データサイエンス(データ分析)のブームが起きてから、5年以上が経過しました。しかし、データサイエンスの活用においては、上手に活用できている企業と活用に失敗した企業の二極化が進んでいます。これはなぜでしょうか?

この理由を考える前に、まずデータサイエンスとは何かを定義しましょう。データサイエンスとは、一般的には意思決定をサポートするために大量のデータから法則・関連性を導き出すための手法に関する研究を指します。なぜ「サイエンス」と呼ばれるかというと、そのデータサイエンスの手法が、科学的アプローチ(①先行研究のリサーチ、②仮説の構築、③実験計画、④実験・解析・結果の整理、⑤論文執筆)の流れに近く、既存の科学的アプローチを応用できることから、データ「サイエンス」と呼ばれています。
データ分析のビジネスへの活用に失敗している企業は、データ分析への理解が浅いために、実験・解析・結果の整理だけに注力している企業が多いように思います。また、実際に分析を行うために必要なデータを蓄積できていなかったり、データ分析を実際に行うデータサイエンティストが不足していることも、問題としてよく耳にします。
そこで、本書は、一冊でデータ分析プロジェクトを行う際の計画からビジネスへの適用までを、広く理解いただくことを目的に執筆いたしました。

本書では、最初にデータ分析とは何かを理解していただくために、先進的な取り組みをしている企業や、データ分析がビジネスにどのように適用できるのかを事例を交えながら説明しています。次に、データ分析の進め方について、課題の発見からビジネスへの適用まで、全般的なプロセスを説明しています。その後、分析に必要なデータを蓄積するためにどのようなシステムが必要なのかを、技術要素を先に説明し、さらにクラウドサービスの利用についても説明しています。さらに、データサイエンティストを育成する方法についても説明しました。

本書を通じて、データ分析をどのように進めるかの理解が深まり、企業のデータ活用に少しでもお役に立てれば幸いです。

2018年12月 執筆メンバー代表 高木章光

高木章光 (著), 鈴木英太 (著)
出版社: 秀和システム (2019/1/23)、出典:出版社HP

CONTENTS

はじめに

第1章 データ分析の最前線
1-1 データ活用の民主化の動き
1-2 データ分析を重要視する企業の増加
1-3 データ分析・機械学習・ディープラーニングの関係
1-4 企業が利用するデータ範囲の拡大
1-5 データの利用に関する契約ガイドラインについて

第2章 データ分析の応用事例
2-1 時系列分析
2-2 併売分析
2-3 最適化問題
2-4 異常検知
2-5 解約防止
2-6 レコメンデーション
2-7 テキストマイニング

第3章 データ分析とは
3-1 データ分析の目的
3-2 データ分析の体系
3-3 データ分析プロジェクトの進め方
3-4 実務におけるデータ分析プロセスフロー (概略)
3-5 実務におけるデータ分析プロセスフロー①
~現状の課題認識・ゴール設定・データ分析の目的検討~
3-6 実務におけるデータ分析プロセスフロー②
~データ分析計画の立案~
3-7 実務におけるデータ分析プロセスフロー③
~データ分析設計書の作成~
3-8 実務におけるデータ分析プロセスフロー④
~データ分析用基盤の準備~
3-9 実務におけるデータ分析プロセスフロー⑤
~データ収集~
3-10 実務におけるデータ分析プロセスフロー⑥
~データの前処理・理解~
3-11 実務におけるデータ分析プロセスフロー⑦
~分析手法の選択と適用~
3-12 実務におけるデータ分析プロセスフロー⑧
~分析結果の評価・施策の提案~
3-13 実務におけるデータ分析プロセスフロー⑨
~データ分析結果のビジネス適用~
3-14 実務におけるデータ分析プロセスフロー⑩
~運用・改善~
3-15 データ分析プロジェクトの進め方
3-16 データ分析を外部の専門家に委託する場合の注意点
3-17 運用について
3-18 事例:Team Data Science Process (TDSP)

第4章 データ分析の技術
4-1 記述統計
4-2 多変量解析
4-3 時系列分析
4-4 ベイズ統計
4-5 機械学習
4-6 ディープラーニング
4-7 データサイエンティストが使用する
プログラミング言語・ツール
4-8 データ分析基盤の全体像
4-9 データ分析基盤を支える技術要素①
~ストリーミング型データ収集:データ収集・蓄積(1)~
4-10 データ分析基盤を支える技術要素②
~バルク型データ収集:データ収集・蓄積(2)~
4-11 データ分析基盤を支える技術要素③
~ストリーム処理:データ収集・蓄積(3)~
4-12 データ分析基盤を支える技術要素④
~データ蓄積:データ収集・蓄積(4)~
4-13 データ分析基盤を支える技術要素⑤
~探索的データ分析・前処理~
4-14 データ分析基盤を支える技術要素⑥
~データ処理~
4-15 データ分析基盤を支える技術要素⑦
~データ分析・活用~
4-16 データ分析基盤を支える技術要素⑧
~管理~
4-17 データ分析用ライブラリについて

第5章 データ分析サービス
5-1 クラウドサービスを用いたデータ分析基盤
5-2 Arm Treasure Data eCDP
5-3 Google Cloud Platform
5-4 Microsoft Azure
5-5 Amazon Web Services (AWS)

第6章 データサイエンティストとは
6-1 データサイエンティストとは
6-2 データサイエンティストに求められる人物像
6-3 データサイエンティストを調達する方法
6-4 データサイエンティストの育成

本書発刊に寄せて
索引
著者プロフィール
参考文献・URL など

高木章光 (著), 鈴木英太 (著)
出版社: 秀和システム (2019/1/23)、出典:出版社HP