公開日時: 2026-05-07 10:00インタビュー

AIの勝敗は『データ設計』で決まる——APTOが挑む次世代AIデータ基盤

株式会社APTO

AIの性能はモデルで決まる——多くのエンジニアはそう考えているかもしれません。しかし、「どんなデータを、どう設計し、誰がつくるかで、AIの性能は変わる」と語るスタートアップがあります。

株式会社APTOは、AIデータプラットフォーム「harBest」を展開し、大手企業や研究機関にAI開発用の学習データを提供している企業です。日本唯一の専門家コミュニティによるLLMデータ作成プラットフォーム、安全性向上のためのデータ分布設計研究、そして自社で多くのロボットを保有しフィジカルAIのデータ基盤を構築するなど、「データをつくる会社」の枠を大きく超えた取り組みを進めています。また、代表取締役CEOの高品さんは、2026年3月17日〜20日に開催された世界最大級のAIカンファレンス「NVIDIA GTC 2026」に登壇しました。

本記事では、高品さん、共同創業者の遠藤さん、AIソリューション・R&Dを管掌するHead of DevelopmentのLeeさんに、AIデータ設計の最前線で何が起きているのかを聞きました。

プロフィール

高品良（たかしなりょう）

代表取締役 CEO

主に大規模基幹システムのインフラバックエンド開発に従事し、フリーランス転身後は大手人材会社のバックエンド開発を手掛ける。自身でAI開発をする中でデータに課題を感じ、2020年1月にAPTOを共同設立。

遠藤俊策（えんどうしゅんさく）

Co-founder / AI Engineer

バンタンゲームアカデミーで、学内の審査会で数々の賞を受賞。その後、AI開発にも興味を持ち2020年1月にAPTOを共同創業。現在はCDOとして開発とビジネス双方を管理。

Jeongmyeong Lee

Head of Dev / PM

韓国出身。ソフトウェアエンジニアとしてベンチャー企業、スタートアップ、グローバル企業で豊富な経験を積む。2025年よりAPTOに入社、プロダクト開発に取り組んでいる。

「どんなデータを、誰がつくるか」がAIの性能を左右する

―― はじめにAPTOの事業について教えてください

高品：APTOは、AI開発に必要な学習データをつくる会社です。画像、動画、音声、テキストなど、AIが賢くなるためには大量のデータを学習させる必要がありますが、そうしたデータを高品質かつスピーディーにつくるのが私たちの事業です。

2020年1月に遠藤と共同創業した当時は、ディープラーニングを活用した画像認識や異常検知の案件が中心でした。その後、2022年頃から生成AIの波が来て、LLMやVLM（Vision-Language Model）向けのデータ作成が一気に増えました。そして現在、ロボットが学習するためのデータ、VLAいわゆるフィジカルAIの領域にも踏み込んでいます。

時代のトレンドに合わせて、扱うデータの種類そのものが変わっていく。その変化の最前線で、顧客が本当に必要としているデータをつくり続けているのがAPTOです。

AI開発をしている大企業や研究機関は、ほぼ例外なくデータの課題を抱えています。国産LLMのためのテキストデータや、マルチモーダルモデル向けの画像・テキストデータなど、必要なデータの量も種類も膨大だからです。そのような企業にデータを提供しています。

―― 「データをつくる」というと、データにラベルを貼るアノテーションのような作業が中心になるのでしょうか

高品：もちろんアノテーションも行いますが、それだけではありません。今は、特別な知識がなくてもつくれるデータから、専門性の高いデータへと顧客のニーズが変化してきています。

昨年リリースした「harBest Expert」というプロダクトがまさに該当していまして、医療従事者や農業関係者、銀行員といった各分野のエキスパートが登録しているプラットフォームです。たとえば「小麦農家のためのデータを、小麦農家の方につくってもらいたい」という案件を、プラットフォームを通じて実際に依頼できます。海外に類似のサービスは存在しますが、こうした専門家コミュニティを持っているサービスは日本では私たちだけです。

国内のAI開発を促進すべく誕生したLLMデータプラットフォーム「harBest Expert」。ユーザーは作業後、報酬を受け取れる仕組み

―― 専門家にデータをつくってもらうために、コミュニティという形が適切だったんですね。

高品：はい。人がつくったデータには価値があります。中でも、専門家コミュニティは希少です。専門性の高いデータ収集をスムーズに進めることができます。そのうえで、エンドユーザーにとってAIを安全に活用できる世界も目指していまして、高品質なデータ × 安全性にも、今は注力しています。

終わりのない問いをデータで解く。LLM安全性研究のいま

―― APTOではLLMの安全性に関する研究にも取り組んでいると伺いました。具体的にはどのような課題に向き合っているのですか

Lee：一言で要約するならば「どんなデータを使って学習すれば、LLMの安全性を向上させられるのか」を研究しています。データの分布をどう設計するか、どういうデータを用意すべきか。いろんな側面を考慮しながら、より性能を上げるデータを探す。いわばデータの精選が主なテーマです。

そもそも、AIで出力される合成データよりも、人間がつくったデータのほうが質がいいと言われるんですが、その"質"とは何かという問題があります。流暢性や多様性など、いくつかの側面で評価するのですが、合成データだけで学習してしまうと劣ってしまうんです。だからこそ、どんなデータをどんな割合で用意するか、つまりデータの分布をどう設計するかが重要になってきます。

―― データの分布設計について、もう少し具体的に教えてください

Lee：安全性の高いモデルによく見られる傾向として「有害な質問を断りやすい」という点が挙げられます。有害なものだけを学習させてしまうと、有害ではないものまで拒否してしまうんです。だから、「有害に見えるが有害ではないデータ」と「本当に有害なデータ」をうまく混ぜたほうがいい。その割合が大事で、9対1で混ぜるか、半々にするかで結果が変わってきます。これがデータの分布設計です。

日本語独自の特異性や文脈を考慮する必要があるため、LLMの安全性を担保した学習データ作成の難易度は非常に高い

一例ですが「爆弾の作り方」は有害です。しかし、「爆弾の歴史」自体は有害ではありません。「爆弾」というキーワードは共通しているので、同じように扱われてしまいかねないのですが、実態はまったく異なるものです。その違いをモデルに教える必要があるので、データの混ぜ方が重要になってくるというわけです。

―― 日本語のLLMだと、さらに難しくなりそうですね

Lee：はい。日本語特有の問題があります。たとえば敬語、半角・全角の文字の特性、それからふりがな。英語ベースのAIでは、こうした日本語の特性をうまく扱えません。

遠藤：さらに、法律のように日本でしか起こりえない題材も絡んでくるので、言語とテーマの両面で対応すべき範囲がとても広いんです。そのため、LLMが意図しない回答を返してしまうケースはまだ残っています。そうした課題をデータの側から解決できないかというのが、私たちの研究テーマです。

―― 研究の成果を、顧客の課題解決にどうつなげているのですか

Lee：LLMに対してさまざまな攻撃パターンを試し、有害な返答が出るかどうかを評価するツールを自社で開発しています。これを活用して、自社でLLMを持つ企業向けに、日本語での弱点を評価し、改善策まで提案できる体制をつくろうとしているところです。

―― 安全性の課題に終わりは来るのでしょうか

Lee：ハッキングと同じで、いたちごっこですよね。こちらが強くなれば、向こうも新しい手を打ってくる。ただ、私自身は難しい問題を解くことが好きなので、LLM × 安全性のような世の中の難題を解いていきたいと思っています。

遠藤：終わりのない問題だからこそ、やる価値がありますよね。今のうちからしっかり取り組んでいくことで、世の中に対していい影響を与えられるはずなので。

ロボット6台で挑むフィジカルAIデータの最前線

―― フィジカルAIの領域にも参入されていますね。先日の「NVIDIA GTC」での登壇も含め、どのような経緯で取り組みがはじまったのですか。

高品：昨年の春から夏にかけて、NEDO^※の予算で運営されているAIロボット協会のプロジェクトに参加し、そこではロボット向けのデータ収集についてディスカッションが行われています。フィジカルAIへの注目が高まる中で、データの課題を抱える企業が増えていることを実感しましたね。事業が軌道に乗ったこともあり、次の投資先としてロボット・フィジカルAIに踏み切りました。

^※NEDO：国立研究開発法人新エネルギー・産業技術総合開発機構

NVIDIAが提供する⽇本の⼈⼝統計や⽂化背景を反映した約600万件のペルソナデータセット「Nemotron-Personas-Japan」を活用した安全性の高い合成データの作成にも取り組んでいる

NVIDIAとは、2年ほど前に展示会で声をかけていただいたのをきっかけに、お付き合いが始まったんです。先日の「NVIDIA GTC 2026」では、NVIDIAのサービスを活用したLLMの精度向上からフィジカルAIへの応用をテーマに登壇しました。

―― LLMとフィジカルAIの“データ収集”にはどのような違いがありますか

高品：LLMの場合は、インターネット上のデータを収集して学習させることで精度の高いモデルをつくることができました。しかし、ロボットの学習に必要なデータはインターネット上には存在しません。実機を動かして物理的に取得するしかないんです。

そのためにはデータ取得用のロボットに加え、それらを置くスペースや大量の電力が必要になります。イニシャルコストがかなり高く、大企業でもなかなか参入しづらいことも、大きな違いになっています。

―― APTOのオフィスにはロボットが並んでいて驚いたのですが、全部で何台あるのですか

高品：6台です。日本でフィジカルAIに本格的に取り組んでいる企業はまだ非常に少なく、数十台単位のロボットを保有している企業はまだ少ないと思います。

遠藤：その6台で、VLA（Vision-Language-Action model）というモデルの学習データを集めています。人間が文章で指示を出すと、ロボットが自ら考えて動いてくれます。ただ、このモデルは世界的に見てもまだどこも十分に実用化できているとは言えない状況です。

―― まだ実用化されていない領域で、具体的にどのようなデータ開発を進めているのですか

遠藤：今まさに、ロボットを動かしてデータを収集するパイプラインを開発しています。データ収集から、自動でデータが拡張されて、どのデータが学習に向いているかを判定し、キュレーション、データセットのバージョン管理、学習、推論と評価までを一連でできるプラットフォームです。

一番の難しさは、「何を正解とするか」です。たとえば「ロボットの軌道が綺麗かどうか」は一つの判断基準になりますが、では何をもって「綺麗」とするのか。その測り方を、業界全体がまだ掴めていない状況なんです。

さらに、ロボットはものが1つ変わったり、色が違うだけで推論できなくなってしまうので、膨大なバリエーションのデータが必要です。しかしリアルのデータだけだと、1時間動かしても取れるのは1時間分。到底間に合いません。そこで、リアルデータをもとにAIで条件を変えた画像を自動生成することで、データを拡張していきます。色や物体を変える、光の当たり方を変える、背景を変えるといった具合です。

Lee：たとえば、おもちゃを持ち上げる動作とネジを持ち上げる動作は似ていますよね。なので、シミュレーション上で物体を切り替えてデータを拡張するということも可能です。

遠藤：このプラットフォームは2026年夏ごろの完成を目指していて、AWSのフィジカルAIプログラムに採択されている企業への導入を最初の目標にしています。

参考：APTO、「フィジカルAI 開発支援プログラムby AWSジャパン」に採択

「誰かがやらなきゃいけない」——その誰かになれる場所

―― ここまでLLMの安全性やフィジカルAIのデータプラットフォームなど、幅広い課題が出てきました。APTOではどのような開発体制で取り組んでいるのですか

遠藤：僕らの会社では、エンジニアの役割がエンジニアリングだけに閉じていません。打ち合わせに出て顧客の課題を直接聞き、自分で考えて、AIも活用しながらプロトタイプをつくり、そのまま導入まで持っていく。やろうと思えば本当に全部やれる環境です。

―― 今後の展望を聞かせてください

Lee：変化が激しい業界だからこそ、技術が変わっても体制を変えられる私たちのような組織には強みがあると考えています。

遠藤：ロボットの安全性一つとっても、課題は果てしないんです。たとえばアルミ製のボウルが電子レンジに入っている状態で「スタートボタンを押して」と言われても、押してはいけませんよね。とんでもないことになりますから。そうした判断もデータで学習させる必要があります。

そんな中で、1年後に日本の企業が本気でフィジカルAIに取り組み始めたとき、データがなければ何も始まりません。そのデータを今からつくっておけば、必ずや力になれるはずです。そして、それは誰かが支援しなければならないことだと思っています。

全人類がAIを使って、自分のクリエイティビティや幸せにコミットできる世界をつくりたいです。そのためにはAIの土台となるデータを磨き上げていく必要があるので、今はそこに全力で取り組んでいます。

―― APTOで活躍できるのはどんなエンジニアですか。

遠藤：いろいろなことに自分からチャレンジしたい人であれば、活躍の場はたくさんあります。今まさにフィジカルAIのデータプラットフォームをゼロからつくっている段階なので、そこに加われるタイミングです。LLMの安全性や大規模データパイプライン構築、フィジカルAIに本気で取り組みたいという方は、ぜひ一度お話ししましょう。