このページの本文へ

【研究開発部門×DX】 研究開発部門が追い求める、効率的な“最適化プロセス”を支援 機械学習の活用に“データプレパレーション”が欠かせないワケコラム

公開日:2021年10月27日

イメージ画像

企業の競争力を生み出す研究開発(R&D)部門では、データ活用をより深めていくことで、研究開発プロセスを効率化し、新たな技術の迅速な市場展開につなげていくことが期待されています。そのような研究開発部門が実施しているデータ活用の現状と、機械学習をはじめとした、AI 技術を活用するための環境づくりの勘所について見ていきます。

  • 生産性が求められる研究開発部門の現在地
  • “事実を理解する”ことで、最適化を目指す
  • 機械学習を活用するために欠かせない“前処理”の重要性
  • データの前処理に最適な方法とは
  • データプレパレーションツールの選び方

生産性が求められる研究開発部門の現在地

企業競争力を高める源泉を生み出すための研究や、技術開発を行っている研究開発部門では、知的財産としての技術獲得を行う基礎研究から、自社の事業推進に生かすための応用研究まで、様々な取り組みが行われています。例えば、食品業界では、新たな原料や包装などに関する基礎研究が行われており、その結果を受けて、効果の高い原料の抽出や応用していく食品の選択など、実際のビジネスに直結する応用研究につなげています。

業界によって取り組む研究内容は大きく異なりますが、マーケティング部門などが期待する販売・需要予測というよりも、多くのシミュレーションを実施しながら、最も適した配合や工程を見つけ出す、組合せの最適化といった高度なデータ分析アプローチが、研究開発部門のテーマとなるケースが一般的です。例えば、スチールを作るときに引張強度や降伏点、伸びの組合せが最善となる原材料比を見つけたい、伸びを同時最適にしたい、表面張力や粘度、濁度を同時に満足させる配合を調べたい。といったニーズが考えられます。

このような場合、これまでは研究者自身の経験や実績から仮説を立案し、その仮説を実証すべく、実験を繰り返していく必要がありました。そして、膨大な素材のなかから最適な組合せを見つけ出していくには、数多くの実験を繰り返していくプロセスが発生します。この仮説検証のプロセスは、研究開発において欠かせないものですが、昨今の景気動向も踏まえると、研究開発においても生産性が重視される傾向にあるのは、ご存じのとおりです。また、企業競争力を高めて競争優位性を確保するためにも、短期間のうちに結果を求められることも少なくありません。

“事実を理解する”ことで、最適化を目指す

そこで、最近注目されているのが、過去の実績データからパターンを学習した予測モデルを構築し、予測モデルを用いた組合せ最適化を行うことで、試行回数を減らすアプロ―チです。このアプローチに適した手法として、機械学習があります。既存のデータからコンピュータが自動で学習を行い、ルールやパターンを発見することで、精度の高い予測モデルを導き出すことが可能な手法として、現在注目されています。また、機械学習によるデータ分析を行うには専門知識の習得が必要不可欠ですが、習得が容易な機械学習プラットフォームを活用することで、この負担を大幅に減らすことに成功した研究開発部門も現れています。

生産性を向上させながら、短期間のうちに成果を出していくためには、膨大なデータを活用して事前に仮説を絞り込み、最適な組合せを導き出すためのテクノロジー活用が不可欠です。すでに多くの研究開発部門で、BIツールや統計解析を駆使して過去の試験データの傾向を分析するといったアプローチは、積極的に行われていることでしょう。

しかし、BIツールや統計解析によるデータ分析は、過去の実績データから傾向を見つけ出したり、発生した現象の原因を分析したりすることに主眼が置かれています。これから行う実験の結果を予測し、最適な組合せとなる確率が高い配合や原材料比に事前に当たりをつけて実験の効率を上げるには、また別のアプローチが必要となります。

機械学習を用いると、「逆問題を解いて最適な配合条件を導き出したい。」といった課題や、「単一の予測スコアだけではなく、前後の予測区間の幅を知りたい。複数のターゲットを同時に最適化したい。」といった課題にも対応できます。その結果、無数に考えられるパターンから効率的に実験の絞り込みを行い、求める結果が得られる確率の高いパターンを実際に実験してみる、といったアプローチが可能になり、ひいては、生産性の高い効率的な研究開発につなげることができるのです。

機械学習プラットフォームは大きく成長が期待されており、AI関連の市場のなかでも、売上金額の伸び率が最も高い分野となっています。

機械学習を活用するために欠かせない“前処理” の重要性

そこで、最近注目されているのが、過去の実績データからパターンを学習した予測モデルを構築し、予測モデルを用いた組合せ最適化を行うことで、試行回数を減らすアプロ―チです。このアプローチに適した手法として、機械学習があります。既存のデータからコンピュータが自動で学習を行い、ルールやパターンを発見することで、精度の高い予測モデルを導き出すことが可能な手法として、現在注目されています。また、機械学習によるデータ分析を行うには専門知識の習得が必要不可欠ですが、習得が容易な機械学習プラットフォームを活用することで、この負担を大幅に減らすことに成功した研究開発部門も現れています。

生産性を向上させながら、短期間のうちに成果を出していくためには、膨大なデータを活用して事前に仮説を絞り込み、最適な組合せを導き出すためのテクノロジー活用が不可欠です。すでに多くの研究開発部門で、BIツールや統計解析を駆使して過去の試験データの傾向を分析するといったアプローチは、積極的に行われていることでしょう。

しかし、BIツールや統計解析によるデータ分析は、過去の実績データから傾向を見つけ出したり、発生した現象の原因を分析したりすることに主眼が置かれています。これから行う実験の結果を予測し、最適な組合せとなる確率が高い配合や原材料比に事前に当たりをつけて実験の効率を上げるには、また別のアプローチが必要となります。

機械学習を用いると、「逆問題を解いて最適な配合条件を導き出したい。」といった課題や、「単一の予測スコアだけではなく、前後の予測区間の幅を知りたい。複数のターゲットを同時に最適化したい。」といった課題にも対応できます。その結果、無数に考えられるパターンから効率的に実験の絞り込みを行い、求める結果が得られる確率の高いパターンを実際に実験してみる、といったアプローチが可能になり、ひいては、生産性の高い効率的な研究開発につなげることができるのです。

機械学習プラットフォームは大きく成長が期待されており、AI関連の市場のなかでも、売上金額の伸び率が最も高い分野となっています。

データの前処理に最適な方法とは

AIプラットフォームにデータを投入するためのデータ前処理には、様々な方法があります。一般的には、Excelのようなスプレッドシートを使った方法をはじめ、データベースとSQLを駆使する方法や、RやPythonなどのプログラミング言語を駆使する方法、そして、データプレパレーションツール(データの前処理ツール)を利用するといった方法が挙げられます。

スプレッドシートを利用する方法は手軽ですが、新たなデータを加えた際のデータ加工の手間が大きくなります。当然、データサイズが大きくなれば、大容量のデータ処理には不向きなExcelでは処理が追い付かないケースも出てきますし、Excelファイルの破損などのリスクにも備えていかなければなりません。

また、データベースから必要なデータをSQLで抽出・加工したり、RやPythonを駆使したりしてデータ加工処理を行うことも可能ですが、当然ながら、専門的なプログラミングのスキルや知識が求められます。現場においては、これらを駆使したデータ加工に長ける方もいるはずですが、属人的な作業になりがちで特定の方に業務が集中してしまうのが現実です。

本来であれば、データ加工の後段であるモデル作成に可能な限りリソースを割き、データの前処理における工数は最小限に抑えたいところでしょう。その意味でも、できる限り効率的にデータ加工が行える環境づくりが必要です。

そこで注目されるのが、データ加工に特化したデータプレパレーションツールです。データプレパレーションツールは、データ変換や加工処理などの設定を行うことで、新たなデータを利用する際にも、処理プロセスが再利用できるというメリットがあります。また、データ分布が可視化できることで、異常値の除去などのクレンジング作業を視覚的に行えるようになり、専門的な統計の知識に依存しないデータ加工が可能になります。もちろん、大文字・小文字の変換や、桁数をそろえる、四則演算を行うといったデータ加工の処理が手軽にGUIから実施でき、様々なデータソースから直接データを収集できるため、異なるプラットフォーム内にあるデータも負担なく活用することが可能です。

関連するソリューション・製品

AI(人工知能)
AIの活用が進み、AIを使ったソリューションが身近になる一方、実用化にまで至らないAIプロジェクトも数多く存在します。
キヤノンITソリューションズでは、長年にわたるSIerとしての経験と業務知識、さらにはR&D部門での研究によって得た知識や、商品開発の技術を駆使して、お客様の課題解決にAIを活用した支援を行います。
データマネジメントサービス
消費者ニーズやビジネス市場の変化に柔軟に対応するためには「データ活用」が必要です。そのデータ活用には、データとデータを活かせる人材が重要です。
ビジネス変革に効果的なデータ活用には、活用の目的に沿ったデータを整備し、そのデータを蓄積する仕組みを作る必要があります。かつデータを分析しインサイト(本質を突いた気付きや洞察)を得るためのデジタル人材が欠かせません。
キヤノンITソリューションズは、データを整備・活用する仕組みを構築し、「価値あるデータ」と「データを活かせる人材(デジタル人材)」の創造を『データマネジメントサービス』として提供することで、お客さまのDX実現を支援します。
  • DXとは、Digital Transformation(デジタルトランスフォーメーション)の略称です。経済産業省ではDXの意味として「企業がビジネス環境の激しい変化に対応し、データとデジタル技術を活用して、顧客や社会のニーズを基に、製品やサービス、ビジネスモデルを変革するとともに、業務そのものや、組織、プロセス、企業文化・風土を変革し、競争上の優位性を確立すること」 と定義されています。
DMS
DataRobot
企業がAIを活用して継続的な成果をあげるためには、以下の3つに関する深い知識・知見を有した人材が必要と言われています。
  • 対象となる事業ドメイン・ビジネス
  • 統計学や機械学習を含むデータサイエンス
  • データとシステムに強いITエンジニア
しかし、これらの異なる領域に精通した人材の確保や育成は非常に難しいのが実情です。
DataRobotとは、生成AIと予測AIの開発・管理・監視をエンドツーエンドで一元化するAIのライフサイクル・プラットフォームです。その機能の1つとして高度で高速なモデル開発を実現する機械学習自動化ソリューションを提供しています。日々更新される数千のアルゴリズムの中からデータと目的に合った最適な機械学習の予測モデルを自動生成することが可能です。
これまでのデータサイエンティストは、相当な時間と試行錯誤を繰り返し予測モデルを開発していましたが、「DataRobot」により学習データを用意するだけで簡単に機械学習を始めることができます。
ただし、AIをビジネスに活用するには、”何を予測するか”、”予測によってビジネスをどう変えていくか”、”AIの予測結果を基にどういった行動を実行するか”、というAI特有の課題設定や具体的なゴール設定をお客さま自身で行っていただく事が必要です。AIの予測結果をビジネスプロセスの一部としてシステムに組み込むことは、継続的な成果の獲得につながります。
キヤノンITソリューションズは、長年システムインテグレーターとして培ったシステム企画・開発ノウハウ、プロジェクト管理経験を基に、専門の知識を有したデータサイエンティストとコンサルタントが、お客さま自らがAIを活用できるよう、機械学習の課題設定からシステム連携まで一貫してご支援いたします。

こちらの記事に関する資料をご提供しています

お申し込み後、ご登録のメールアドレスに資料のダウンロード用URLをご案内いたします。是非お気軽に、お申込みください。