ホーム > コラム・レポート > コラム > 【研究開発部門×DX】
研究開発部門が追い求める、効率的な“最適化プロセス”を支援
機械学習の活用に“データプレパレーション”が欠かせないワケ
  • コラム

【研究開発部門×DX】
研究開発部門が追い求める、効率的な“最適化プロセス”を支援
機械学習の活用に“データプレパレーション”が欠かせないワケ

イメージ画像

企業の競争力を生み出す研究開発(R&D)部門では、データ活用をより深めていくことで、研究開発プロセスを効率化し、新たな技術の迅速な市場展開につなげていくことが期待されています。そのような研究開発部門が実施しているデータ活用の現状と、機械学習をはじめとした、AI 技術を活用するための環境づくりの勘所について見ていきます。

目次

  • 1.生産性が求められる研究開発部門の現在地
  • 2.“事実を理解する”ことで、最適化を目指す
  • 3.機械学習を活用するために欠かせない“前処理”の重要性
  • 4.データの前処理に最適な方法とは
  • 5.データプレパレーションツールの選び方

生産性が求められる研究開発部門の現在地

企業競争力を高める源泉を生み出すための研究や、技術開発を行っている研究開発部門では、知的財産としての技術獲得を行う基礎研究から、自社の事業推進に生かすための応用研究まで、様々な取り組みが行われています。例えば、食品業界では、新たな原料や包装などに関する基礎研究が行われており、その結果を受けて、効果の高い原料の抽出や応用していく食品の選択など、実際のビジネスに直結する応用研究につなげています。

業界によって取り組む研究内容は大きく異なりますが、マーケティング部門などが期待する販売・需要予測というよりも、多くのシミュレーションを実施しながら、最も適した配合や工程を見つけ出す、組合せの最適化といった高度なデータ分析アプローチが、研究開発部門のテーマとなるケースが一般的です。例えば、スチールを作るときに引張強度や降伏点、伸びの組合せが最善となる原材料比を見つけたい、伸びを同時最適にしたい、表面張力や粘度、濁度を同時に満足させる配合を調べたい。といったニーズが考えられます。

このような場合、これまでは研究者自身の経験や実績から仮説を立案し、その仮説を実証すべく、実験を繰り返していく必要がありました。そして、膨大な素材のなかから最適な組合せを見つけ出していくには、数多くの実験を繰り返していくプロセスが発生します。この仮説検証のプロセスは、研究開発において欠かせないものですが、昨今の景気動向も踏まえると、研究開発においても生産性が重視される傾向にあるのは、ご存じのとおりです。また、企業競争力を高めて競争優位性を確保するためにも、短期間のうちに結果を求められることも少なくありません。

“事実を理解する”ことで、最適化を目指す

そこで、最近注目されているのが、過去の実績データからパターンを学習した予測モデルを構築し、予測モデルを用いた組合せ最適化を行うことで、試行回数を減らすアプロ―チです。このアプローチに適した手法として、機械学習があります。既存のデータからコンピュータが自動で学習を行い、ルールやパターンを発見することで、精度の高い予測モデルを導き出すことが可能な手法として、現在注目されています。また、機械学習によるデータ分析を行うには専門知識の習得が必要不可欠ですが、習得が容易な機械学習プラットフォームを活用することで、この負担を大幅に減らすことに成功した研究開発部門も現れています。

生産性を向上させながら、短期間のうちに成果を出していくためには、膨大なデータを活用して事前に仮説を絞り込み、最適な組合せを導き出すためのテクノロジー活用が不可欠です。すでに多くの研究開発部門で、BIツールや統計解析を駆使して過去の試験データの傾向を分析するといったアプローチは、積極的に行われていることでしょう。 

しかし、BIツールや統計解析によるデータ分析は、過去の実績データから傾向を見つけ出したり、発生した現象の原因を分析したりすることに主眼が置かれています。これから行う実験の結果を予測し、最適な組合せとなる確率が高い配合や原材料比に事前に当たりをつけて実験の効率を上げるには、また別のアプローチが必要となります。 

機械学習を用いると、「逆問題を解いて最適な配合条件を導き出したい。」といった課題や、「単一の予測スコアだけではなく、前後の予測区間の幅を知りたい。複数のターゲットを同時に最適化したい。」といった課題にも対応できます。その結果、無数に考えられるパターンから効率的に実験の絞り込みを行い、求める結果が得られる確率の高いパターンを実際に実験してみる、といったアプローチが可能になり、ひいては、生産性の高い効率的な研究開発につなげることができるのです。

機械学習プラットフォームは大きく成長が期待されており、AI関連の市場のなかでも、売上金額の伸び率が最も高い分野となっています。

機械学習を活用するために欠かせない“前処理” の重要性

そこで、最近注目されているのが、過去の実績データからパターンを学習した予測モデルを構築し、予測モデルを用いた組合せ最適化を行うことで、試行回数を減らすアプロ―チです。このアプローチに適した手法として、機械学習があります。既存のデータからコンピュータが自動で学習を行い、ルールやパターンを発見することで、精度の高い予測モデルを導き出すことが可能な手法として、現在注目されています。また、機械学習によるデータ分析を行うには専門知識の習得が必要不可欠ですが、習得が容易な機械学習プラットフォームを活用することで、この負担を大幅に減らすことに成功した研究開発部門も現れています。

生産性を向上させながら、短期間のうちに成果を出していくためには、膨大なデータを活用して事前に仮説を絞り込み、最適な組合せを導き出すためのテクノロジー活用が不可欠です。すでに多くの研究開発部門で、BIツールや統計解析を駆使して過去の試験データの傾向を分析するといったアプローチは、積極的に行われていることでしょう。 

しかし、BIツールや統計解析によるデータ分析は、過去の実績データから傾向を見つけ出したり、発生した現象の原因を分析したりすることに主眼が置かれています。これから行う実験の結果を予測し、最適な組合せとなる確率が高い配合や原材料比に事前に当たりをつけて実験の効率を上げるには、また別のアプローチが必要となります。 

機械学習を用いると、「逆問題を解いて最適な配合条件を導き出したい。」といった課題や、「単一の予測スコアだけではなく、前後の予測区間の幅を知りたい。複数のターゲットを同時に最適化したい。」といった課題にも対応できます。その結果、無数に考えられるパターンから効率的に実験の絞り込みを行い、求める結果が得られる確率の高いパターンを実際に実験してみる、といったアプローチが可能になり、ひいては、生産性の高い効率的な研究開発につなげることができるのです。

機械学習プラットフォームは大きく成長が期待されており、AI関連の市場のなかでも、売上金額の伸び率が最も高い分野となっています。

データの前処理に最適な方法とは

AIプラットフォームにデータを投入するためのデータ前処理には、様々な方法があります。一般的には、Excelのようなスプレッドシートを使った方法をはじめ、データベースとSQLを駆使する方法や、RやPythonなどのプログラミング言語を駆使する方法、そして、データプレパレーションツール(データの前処理ツール)を利用するといった方法が挙げられます。

スプレッドシートを利用する方法は手軽ですが、新たなデータを加えた際のデータ加工の手間が大きくなります。当然、データサイズが大きくなれば、大容量のデータ処理には不向きなExcelでは処理が追い付かないケースも出てきますし、Excelファイルの破損などのリスクにも備えていかなければなりません。

また、データベースから必要なデータをSQLで抽出・加工したり、RやPythonを駆使したりしてデータ加工処理を行うことも可能ですが、当然ながら、専門的なプログラミングのスキルや知識が求められます。現場においては、これらを駆使したデータ加工に長ける方もいるはずですが、属人的な作業になりがちで特定の方に業務が集中してしまうのが現実です。
本来であれば、データ加工の後段であるモデル作成に可能な限りリソースを割き、データの前処理における工数は最小限に抑えたいところでしょう。その意味でも、できる限り効率的にデータ加工が行える環境づくりが必要です。

そこで注目されるのが、データ加工に特化したデータプレパレーションツールです。データプレパレーションツールは、データ変換や加工処理などの設定を行うことで、新たなデータを利用する際にも、処理プロセスが再利用できるというメリットがあります。また、データ分布が可視化できることで、異常値の除去などのクレンジング作業を視覚的に行えるようになり、専門的な統計の知識に依存しないデータ加工が可能になります。もちろん、大文字・小文字の変換や、桁数をそろえる、四則演算を行うといったデータ加工の処理が手軽にGUIから実施でき、様々なデータソースから直接データを収集できるため、異なるプラットフォーム内にあるデータも負担なく活用することが可能です。

関連するソリューション・製品

ホーム > コラム・レポート > コラム > 【研究開発部門×DX】
研究開発部門が追い求める、効率的な“最適化プロセス”を支援
機械学習の活用に“データプレパレーション”が欠かせないワケ