AI-Pass 第1章 AI(人工知能)

AI(人工知能)の定義

キーワード
  • AI(人工知能)
  • ダートマス会議

AIとは

  • 定義:人間の知能に近い人工的な知識を持ったコンピュータ
    ※明確には定められていない

AIとロボットの区別

AI・人間で言えば「脳」
・人間の知能を再現する能力を持ったソフトウェア、アプリケーション
ロボット・人間で言えば「体」
・AI技術を搭載して自動的に動く物理的な機械

AIの研究

  • 「AI」と言う用語は、1956年「ダートマス会議」と呼ばれる研究会議で、アメリカの「ジョン・マッカーシー」らによって始めて使用された。
  • AI研究が始まった背景は、第二次世界大戦や計算機の発展がある
ジョン・マッカーシー
画像出典:Wikimedia Commons
作者:Stanford University
ライセンス:CC BY-SA 2.0
https://creativecommons.org/licenses/by-sa/2.0/

ジョン・マッカーシー

人工知能(AI)

AIに知能をもたらす仕組み

キーワード
  • ルールベース
  • 機械学習
  • 教師あり学習
  • 教師なし学習
  • 半教師あり学習
  • クラスタリング
  • 次元削減
  • 強化学習
  • ノーフリーランチ定理

知能をもたらす2つの仕組み

  1. ルールベース
  2. 機械学習

ルールベース

  • 人間が事前に作成したルールや知識をプログラムに組み込むことで、予測や判断を行う技術。
  • 複雑な問題に対処するために大量のルールが必要であるため管理が困難になる。

機械学習

  • 機械(コンピュータ)が統計的手法やアルゴリズムを用いて入力した大量のデータからパターンを見出し、予測や判断を行う技術(自ら学習する)
  • 現在の主流

機械学習の手法

  1. 教師あり学習
  2. 教師なし学習
  3. 半教師あり学習
  4. 強化学習

教師あり学習

  • 入力したデータに対して正解データ(教師データ)のペアを与えて、モデルを訓練する手法
    (「ラベル付きデータ」:すでに正解が示されている問題)
  • 「入力データ」と「正解データ」を反復的に学習(特徴を学習)することで、新しいデータに対しても正しい答えを予測できるようになる。

教師なし学習

  • 入力したデータに対して正解データを与えず、データ自体のパターンや構造を自ら見つけ出す手法
    (「ラベルなしデータ」:正解が示されていない問題)
  • 教師なし学習の代表的な手法
    • クラスタリング(分類)
      • 与えられたデータを類似した特徴やパターンを持つグループ(クラススター)に分類する。
      • データの理解や分析、異常検知に役に立つ。
    • 次元削減(特徴の圧縮)
      • データの次元(変数)を減らし、詳細を省いて必要な情報だけを残して、よりシンプルな形で情報(特徴)を認識する。
      • データの可視化や解析が容易になる。

半教師あり学習

  • 一部を「教師あり学習」で、残りを「教師なし学習」と組み合わせて行う手法
  • メリット
    • 少量のラベル付きデータを用意すればよいので、学習コストを抑えることができる
  • デメリット
    • 教師あり学習と比較すると学習精度が低くなることが多い
    • 正解ラベル付ける際に偏りが生じる
    • 予測されたラベルが正確でない可能性がある

強化学習

  • コンピュータに対して目標を設定し、その目標の達成に近づくたびに報酬(褒美)を与える。
  • 目標を達成するための最適な行動を自ら学習させる手法
    どのような行動をすれば報酬が最大化されるかを学んでいき、徐々に最適な行動を学習していく。

機械学習の手法

ノーフリーランチ定理

  • ノーフリーランチ定理とは、「どの問題にも万能で汎用的なモデルは存在しない
  • AIを利用する目的や処理データの種類などを考慮して、最適な手法を選択することが重要。

人間の脳とニューラルネットワーク

キーワード
  • ニューロン
  • シナプス
  • 人工ニューロン(ノード)
  • ニューラルネットワーク
  • ディープラーニング
  • 重み、情報の重みづけ
  • 過学習
  • 正則化
  • ドロップアウト
  • 転移学習
  • 学習済みモデル

人間の脳の仕組み

  • 人間の脳には、高度な働きを支えている神経細胞があり、その個々の神経細胞のことは「ニューロン」という
  • ニューロンは、多くの突起を持つ複雑な形状が特徴で、この突起には情報をやり取りする「シナプス」がある

人工ニューロンとニューラルネットワーク

  • 人間の脳と神経細胞の仕組みをプログラミングによって再現(模倣)したものを「人口ニューロン(ノード)」という
  • 人工ニューロンによる複層的な情報伝達の仕組みを「ニューラルネットワーク」という
  • ニューラルネットワークをさらに何層にも重ねて作ったシステム用いた学習手法を「ディープラーニング(深層学習)」という

AI学習における「重み」と「重み付け」

  • ニューラルネットワークが情報を処理する際は、すべての情報を均一に扱うのではなく、どの情報が重要で、どの情報がそれほど重要でないかを区別している
  • 情報や事象の重要性そのものを「重み」という
  • ニューラルネットワークを構成する人工ニューロン(ノード)が情報の重要性を調整すること(重要性に差異を設けること)を「重み付け」という

過学習(オーバーフィッティング)

過学習とは

  • 過学習とは、機械学習のモデルが訓練データ(学習データ)をあまりにも正確に学習しすぎて、その訓練データのみに過剰に適合し、未知のデータに対して柔軟に予測できなること
  • 過学習の状態になると訓練データに対して高い精度になる反面、未知のデータに対して予測精度が著しく低下する

過学習を避ける手法

  1. アーリーストッピング
  2. 正則化
  3. ドロップアウト

アーリーストッピング

  • 学習中に検証データの性能を定期的に確認し、過学習が始まる前に学習を終了させる手法である
  • 停止後に同じ学習を再開することはしない
  • 多くの場合、検証性能が最も良かった時点のモデルを採用する
  • 一時停止や再開を目的とした手法ではない

正則化

  • モデルが訓練データに過度に適合(過学習)するのを防ぐための手法である
  • モデルのパラメータ(重み)が過度に大きくならないよう制限・調整する

ドロップアウト

  • 学習時にランダムに一部の人工ニューロンを無効化することで、過学習を防ぐ手法である
  • 特定のニューロンや構造への依存を防ぎ、汎化性能を向上させる
  • 推論時には、すべてのニューロンを使用する

転移学習

転移学習とは

  • AIが1つのタスクから学んだ知識を別のタスクへと活用する学習手法
  • 既に得た知識を活用できるため、より効果的に学習できる
  • 学習済みモデルを利用

学習済みモデル

  • あらかじめ大量のデータで学習を完了したモデル
  • 転移学習やファインチューニングで再利用される

AIの種類

キーワード
  • 特徴量
  • 弱いAI(ANI)
  • 強いAI(AGI)

AIの4つのレベル

  • AIにはレベル1~4の4つがある
レベル利用内容特徴
レベル1AI家電
・冷蔵庫
・エアコンなど
制御プログラム条件による分岐で構成された単純な制御プログラ
レベル2・チャットボット
・音声認識システム
ルールベースシステムデータを解析して、単純な予測や決定を行う
レベル3・検索エンジン機械学習特徴量の設定(人間)により多様な出力ができる
レベル4・自動運転技術ディープラーニング特徴量をモデル自ら調整し、大量データ処理ができる

特徴量とは

  • AI(機械学習)がデータを判断・予測するために利用する「入力情報」

ANIとAGI

ANI(Artificial Narrow Intelligence)

  • Narrow:狭い(限定された)
  • 特定のタスクに限定して能力を発揮する人工知能
  • 現在実用化されているAIの多くがANIに該当する
  • 特定タスク以外の問題には対応できない(汎用的な知能は持たない)

AGI(Artificial General Intelligence)

  • General:すべての
  • 人間と同等の汎用的な知能を持つ人工知能
  • 特定のタスクに限定されず、幅広い問題に対応できる
  • 現時点では実現していない

AIの歴史

キーワード
  • 第一次AIブーム
  • 探索
  • 推論
  • 第二次AIブーム
  • エキスパートシステム
  • AIの冬
  • 第三次AIブーム
  • ビッグデータ

第一次AIブーム

  • 1956年にダートマス会議をきっかけに始まり、約20年間にわたりAI研究が進展した
  • 探索や推論を中心とした、ルールベースのAIが主流であった
  • 1970年代後半に限界(ルールベースが複雑な問題に対して不適切である)が指摘され、ブームが終息し、AIの冬に入った

第二次AIブーム

  • 1980年代に、コンピュータの性能向上を背景として、専門家の知識を取り込んだエキスパートシステムが注目を集めた
  • 知識ベースの肥大化保守・管理の困難さが問題となり、ブームが終息し、AIの冬に入った

第三次AIブーム

  • 2010年代に入ってから現在まで続いている
  • ビッグデータの活用ディープラーニング技術の発展が特徴
  • 計算資源の向上により、高精度な学習が可能になった
探索
  • 問題を解決するために、考えられる解の候補(状態空間)の中から解を見つけ出すプロセス
推論
  • ・与えられた事実(知識)とルールを基に、論理的に新しい結論や事実を導き出すプロセス
AIの冬
  • AIブームが終息した後に、研究や投資が停滞する時期のこと

シンギュラリティ(技術的特異点)

キーワード
  • シンギュラリティ(技術的特異点)
  • ヴァーナー・ヴィンジ
  • レイ・カーツワイル
  • 2045年問題
  • AI効果

シンギュラリティ(技術的特異点)とは

  • AIが人間の知能を超え、自己進化を続けるとされる状態
  • この概念は、ウァーナー・ウィンジが提唱した
画像出典:Wikipedia
作者:Raul654
ライセンス:CC BY-SA 3.0

ウァーナー・ウィンジ

シンギュラリティを提唱!

2045年問題

  • レイ・カーツワイルが提起した問題
  • 2045年頃にシンギュラリティが到来すると予測されている
  • AIの急速な進化により、人間社会が大きな影響を受ける可能性がある

レイ・カーツワイル

2045年、シンギュラリティに到達する!

画像出典:Flickr
作者:”null0″
ライセンス:CC BY-SA 2.0
https://creativecommons.org/licenses/by-sa/2.0/

AI効果

  • AI技術が日常に浸透することで、その革新性や価値が「当たり前」と感じられるようになり、AIによる成果であると認識されなくなる現象

コメント