Appleの調査でAIの論理的推論能力に重大な欠陥が明らかに

  • wviaeu
  • 0 comments
Appleの調査でAIの論理的推論能力に重大な欠陥が明らかに

新たに発表された研究によると、Apple の AI 研究チームは、大規模言語モデルの推論能力に重大な弱点があることを発見した。

Apple Silicon AIに最適化された機能 Siri 1
arXivに掲載されたこの研究は、OpenAI、Meta、その他の著名な開発者によるものを含む、主要な言語モデルをAppleが評価し、これらのモデルが数学的推論タスクをどの程度うまく処理できるかを検証した概要を示しています。調査結果によると、質問の表現をわずかに変更するだけで、モデルのパフォーマンスに大きな差異が生じ、論理的一貫性が求められるシナリオでは信頼性が損なわれる可能性があることが明らかになりました。

Appleは、言語モデルにおける根深い問題、すなわち真の論理的推論ではなくパターンマッチングへの依存に注目しています。研究者たちは複数のテストにおいて、質問に無関係な情報(数学的な結果に影響を与えないはずの詳細)を追加すると、モデルとは大きく異なる答えが得られる可能性があることを実証しました。

論文で示された例の一つは、ある人が数日間かけてキウイを何個集めたかを問う簡単な数学の問題です。キウイの大きさに関する無関係な情報が導入された際、OpenAIのo1やMetaのLlamaといったモデルは、解には全く関係のない追加情報であるにもかかわらず、最終的な合計値を誤って調整してしまいました。

言語モデルには形式的な推論の証拠は見つかりませんでした。その動作は、洗練されたパターンマッチングによってより適切に説明されます。実際、このパターンマッチングは非常に脆弱であるため、名前を変更すると結果が約10%変化する可能性があります。

この推論の脆弱性から、研究者たちは、これらのモデルは問題を解決するために真の論理を用いているのではなく、訓練中に学習した高度なパターン認識に依存していると結論付けました。彼らは「単に名前を変えるだけで結果が変わる可能性がある」ことを発見しました。これは、現実世界の文脈において一貫性と正確性を求めるAIアプリケーションの将来にとって、潜在的に懸念すべき兆候です。

研究によると、Llamaのような小規模なオープンソース版からOpenAIのGPT-4oのような独自モデルまで、テストされたすべてのモデルは、入力データにおける一見取るに足らない変化に直面した際に、著しいパフォーマンスの低下を示した。Appleは、AIがより正確な意思決定と問題解決能力を獲得するためには、ニューラルネットワークと従来のシンボルベース推論(ニューロシンボリックAI)を組み合わせる必要があるかもしれないと示唆している。

人気のストーリー

iOS 26.1からiOS 26.4では、iPhoneに以下の新機能が追加されます

2025年10月1日水曜日午後1時26分(PDT)ジョー・ロシニョール

iOS 26は先月リリースされましたが、ソフトウェアの進化は止まることなく、iOS 26.1のベータテストはすでに開始されています。iOS 26.1では、Apple Intelligenceと対応AirPodsのライブ翻訳が追加の言語で利用可能になったほか、Apple Music、カレンダー、写真、Safariにもいくつかの小さな変更が加えられています。今後のバージョンでは、さらに多くの機能と変更が予定されています。

新型iPhoneの需要は1機種を除いて「予想を上回る」

2025年10月2日木曜日午前7時26分(PDT)ジョー・ロシニョール

iPhone 17シリーズの発売から約2週間後、投資銀行モルガン・スタンレーのアナリストは、Appleのオンラインストアにおける出荷予定の延長とAppleのサプライチェーンから収集した情報に基づき、同機種の需要は「当初の予想よりもやや強まっている」と述べた。iPhone 17、iPhone 17 Pro、…の初期需要は堅調だった。

昨日リークされたAppleの新製品一覧

2025年10月1日水曜日午前8時27分(PDT)ジョー・ロシニョール

昨日、ロシアのYouTube動画と、Appleの機密保持要請にもかかわらず公開された米国連邦通信委員会(FCC)の文書を組み合わせ、Appleの次期製品に関する情報がいくつかリークされました。リークされた製品には、M5チップを搭載したiPad Pro、アップデートされたMacBook Pro、そしてApple Vision Proモデルが含まれています。これらのデバイスはいずれも既に噂されていました…

AppleのiPhone運転免許証機能が米国11州で利用可能に

2025年9月30日火曜日午前6時40分PDT ジョー・ロシニョール

一部の米国州では、住民は運転免許証または州発行の身分証明書をiPhoneとApple WatchのWalletアプリに追加できます。これにより、一部の空港や店舗、一部のアプリで、身分証明書や年齢証明を非接触で便利に提示できるようになります。Appleは最近、この機能がノースダコタ州でもまもなく利用可能になると発表しており、本日から正式に利用可能になりました。

Appleのイベントは10月に?何が期待できるのか

2025年9月29日月曜日午前9時31分(PDT)ジョー・ロシニョール

Appleの毎年恒例のiPhoneイベントは終了しましたが、噂によると、年末までにいくつかの追加製品をリリースする予定とのことです。今年の10月にAppleのイベントは開催されるのでしょうか?その可能性については、以下で考察します。10月のAppleイベント Appleが最近10月にイベントを開催したのは2021年と2023年です。2022年と2024年には、Appleは10月にイベントを開催しませんでした。その代わりに…

FCC、Appleの次期Vision Proを誤ってリーク

2025年9月30日火曜日午後3時48分(太平洋夏時間)Juli Clover

米国連邦通信委員会(FCC)は、AppleがVision Proヘッドセットのアップデート版の開発を進めていることを正式に認めたようです。FCCが本日公開した複数の文書の1つには、Appleが設計したモデル番号A3416の「ヘッドマウントデバイス」が記載されています。添付された画像から、このデバイスがVision Proであることが確認できます。FCCがアップロードした資料は、伝送試験、SAR試験報告書、そして…

FCC、次期MacBook Proなどの情報をリーク

2025年9月30日火曜日午後1時58分(太平洋夏時間)Juli Clover

米国連邦通信委員会(FCC)は、AppleがMacBook Proの新バージョンとその他複数の製品の開発に取り組んでいることを確認し、発売前にこれらの製品の詳細をリークしました。FCCは、既存のデバイスとは一致しないモデル番号を参照する文書を公開しました。例えば、A3434は未発表のMacBook Proを指し、他の番号は…

Appleの2025年製品ロードマップ:今後の予定

2025年10月1日水曜日午後3時56分(太平洋夏時間)Juli Clover

Appleの年間2大イベント、WWDCとiPhone発表は終了しましたが、年末までに発表が期待される新製品がまだいくつかあります。Apple TV。Apple TVは2022年以降アップデートされていないため、そろそろ刷新の時期です。Appleがセットトップボックスのデザインを変更する予定はないようですが、Appleのコードによると、より高速なチップの搭載が期待されます…

M5チップ搭載の新型iPad Pro、開封動画でリーク

2025年9月30日火曜日午前8時39分(PDT)ジョー・ロシニョール

M5チップを搭載した未発表iPad Proの開封動画と思われる動画が、ロシアのチャンネルWylsacomによって本日YouTubeに投稿されました。このYouTubeアカウントは、昨年Appleが発表する前にM4チップを搭載した14インチMacBook Proをリークしていたため、これはおそらく正規のリークです。動画に映っている箱から判断すると、これはM5チップと256GBのストレージを搭載した13インチiPad Proのようです。

iPhoneの使い方を変えるiOSの26の隠されたトリック

2025年10月1日水曜日午前9時16分(太平洋夏時間) Tim Hardwick

Appleは9月中旬にiOS 26をリリースし、世界中のiPhoneに様々な新機能と変更をもたらしました。しかし、含まれている改善点の全てがAppleらしい華々しく宣伝されたわけではなく、多くの改善点が見落とされている可能性があります。以下では、iPhoneの日常的な使い方を変える可能性のある、あまり知られていない26の追加機能と機能強化をご紹介します。