ホーム > コラム・レポート > コラム > 機械学習が簡単に! 実際に使ってみたからこそ分かるDataRobotの便利ポイント3選
  • コラム

機械学習が簡単に! 実際に使ってみたからこそ分かるDataRobotの便利ポイント3選

AIプロジェクトの始め方

データを活用して社内のDXを推進する際、機械学習を導入することは難しそうだと感じることがありませんか。データサイエンティストでないと取り組みにくいイメージもあるでしょう。しかし、今回ご紹介するDataRobotという機械学習のサービスを利用することで、誰でも簡単にデータを活用し、DXを進めることができるようになります。なぜそういったことが可能になるのか、機械学習について初心者だった私が実際に使用してみて感じたその便利な機能を厳選して3点ほど紹介します。

目次

  • 1.DataRobotとは
    1.1 機械学習の概要
    1.2 DataRobotの概要
  • 2.便利ポイント3選
    2.1 ポイント①:データを入れてボタンを押すだけ!最適なモデルが自動で選定される
    2.2 ポイント②:精度が一目瞭然!できたモデルを自動で評価、精度がすぐにわかる
    2.3 ポイント③:可視化機能が豊富!予測結果に納得できる
  • 3.さいごに

1.DataRobotとは

1.1. 機械学習の概要

まずは機械学習とはどういったものなのか、何ができるのかを説明します。機械学習とは人工知能(AI)の1つであり、コンピュータが大量のデータを分析し傾向を学習して、その傾向(モデル)を新規データに適用して未来を予測する技術のことです。例えば製造業の場合、この技術を応用することで、製品の中から不良品を自動で判別することが可能であり、また製品や部品の需要を予測することもできます。これにより在庫余剰や人件費などのコストを削減できる可能性があります。
通常、機械学習の予測モデルを作るにはPython、Rといったプログラミング言語を用いるのが一般的です。

1.2. DataRobotの概要

DataRobotとは、高度で高速なモデル開発を実現する機械学習自動化プラットフォームです。このプラットフォームには、世界的なデータ分析コンペティション「Kaggle」で高い成績を収めたデータサイエンティストのデータ分析ノウハウが組み込まれています。数ステップの操作で、高精度な機械学習モデルを自動的に構築することができます。さらに、モデルの構築だけでなく、実際のビジネスへの組み込みまでの一連のサイクルを自動化することも可能です。

2.便利ポイント3選

2.1. ポイント① データを入れてボタンを押すだけ!最適なモデルが自動で選定される

まずご紹介する便利なポイントは、ボタン一つでモデルが自動で作成されるという点です。
機械学習を進める上で大変な点として1つ挙げられるのが、解決したい課題に適したモデルを選択し、そのモデルにデータを流して傾向を学習させるという予測モデル構築の作業に対する敷居が高いことです。データの種類や予測するテーマによって適切なモデルは異なるため、どのモデルが良いかを判断するというのはプロのデータサイエンティストでなければ難しい作業です。しかし、DataRobotはその作業を完全に自動化してくれます。
データをアップロードし、予測したい項目を設定したら、あとは開始のボタンを押すだけでモデル構築までを自動で行ってくれるのです。通常であれば、データサイエンティストがおおよそ数週間かけて、Python等のプログラミング言語を用いて予測モデルを作成しなければならないところを、DataRobotであればわずか数十分で自動作成することが可能です。この手軽さとスピード感はお客様からも高く評価されています。

AIプロジェクトの始め方

また、この自動生成されるモデルは、DataRobotの優れたデータサイエンティストのノウハウによってデータの前処理が自動でなされ、数千のアルゴリズムから最適なモデルが選ばれるので、高速にモデル改善のプロセスを回すことが可能です。

2.2. ポイント② 精度が一目瞭然!できたモデルを自動で評価、精度がすぐにわかる

次にご紹介するのは、作成されたモデルの精度が簡単にチェックでき、良いモデルかどうかをすぐに確認することができる機能です。
モデルが構築できたら、そのモデルの予測精度を評価する必要があります。精度を確認するにはいくつかの指標があるのですが、プログラミングで算出しようとすると予測の目的によって適切な評価指標を選択し、一つひとつライブラリを使いこなして算出する必要があります。DataRobotでは、作成されたモデルに適した評価指標を自動的に選択し、自動で計算し、精度の高い順に一覧で表示されますので、どのモデルの精度が高いかが一目でわかります。また、DataRobotで使える評価指標は一般的によく使われるものを網羅しており、テーマに応じてマニュアルで変更して様々な指標で確認することもできます。それぞれの指標で確認しながら、良いモデルだけを簡単に選択することができるようになります。

AIプロジェクトの始め方

他にも、データサイエンスでよく用いられる混同行列、ROC曲線、予測分布といった視覚的に分かりやすい評価方法にも対応しています。

AIプロジェクトの始め方

2.3. ポイント③ 可視化機能が豊富!予測結果に納得できる

最後にご紹介するのが、豊富な可視化機能です。
予測結果をビジネスに組み込む際、たとえ精度の高いモデルができたとしても、単にモデルが予測したからという理由だけでは現場レベルでの納得が得られない可能性があります。DataRobotでは予測結果がブラックボックスにならないように、モデルがデータをどのように解釈したかを可視化する図やグラフを自動で生成してくれる機能が豊富に備わっています。Python等でこれらをやろうとすると、多数のライブラリや説明可能なAIの手法を使いこなす必要がありますが、その手間は一切必要ありません。
例えば、予測結果を出すにあたって重要視されている項目や、予測したデータ1件1件に関してもその決め手となった項目などの根拠をデータから確認することができます。そのため、データサイエンティストのような人でなくても、作成されたグラフを見ることで、どういったモデルができているかを簡単に理解できるように設計されています。
下図の例では、お金を貸した際の貸し倒れの発生を予測していますが、年収が高い人ほど貸し倒れにくいという傾向が示されています。このような人間が想像する結果と近い結果を実際にデータから確認することで、理解しやすく、より納得感が得られるのではないでしょうか。

AIプロジェクトの始め方

3.さいごに

ここまで私が現場でDataRobotを利用してきて感じた便利なポイントをご紹介させていただきました。ご紹介した内容を参考に、少しでも機械学習に対するハードルが下がったと感じていただければ幸いです。また、当サービスには他にも様々な機能があり、学習のコースも用意されています。ぜひ実際に体験してみていただき、データ活用をさらに推進していただければと思います。
当社でも事前知識ゼロで参加できる体験型のハンズオンを提供しています。こちらに参加いただくと、さらに具体的な実用化のイメージを掴んでいただけると思います。もちろんDataRobotのことだけでなく、データの利活用全般に関するご相談も受け付けておりますので、お気軽にお問い合わせください。

筆者紹介

キヤノンITソリューションズ株式会社 中田 俊太朗

島村 健士朗(しまむら けんしろう)

キヤノンITソリューションズ株式会社 デジタルビジネス統括本部
デジタルソリューション開発本部 デジタルビジネス推進部

<略歴>
2022年よりデータサイエンティスト業務に従事
保有資格  JDLA Deep Learning for GENERAL 2023#5など

関連するソリューション・製品

ホーム > コラム・レポート > コラム > 機械学習が簡単に! 実際に使ってみたからこそ分かるDataRobotの便利ポイント3選