AIのインタラクションデザインに関する実践的知識は発展途上なうえに、そもそも日本国内だと現場経験もまだまだ得られにくいですよね。なので、国内外問わず適当なものがあったらこちらで紹介できたらと思っています。

手始めにMicrosoft Researchのブログに、“Guidelines for Human-AI Interaction”なるもののサマリとペーパーがアップされていたので、今回はそちらの抄訳です(超抜粋版)。

※ペーパーには割と刺激になりそうな事例が充実しているので、都度更新できたらとも


Human-AI インタラクションデザイン ガイドライン(抄訳)

背景:

  • AIによるパターン認識の精度向上は、音声認識や翻訳、物体認識、顔認識などをアプリケーションに組み込むことを可能にした
  • ただ、AIの推論はユーザにとって不確実性が伴い、時として混乱させ、台無しにし、危険でさえある予測不能な挙動を示すことも
  • AI搭載システム(AI-infused system)は、確立された伝統的なユーザビリティ原則に反することがある
  • 例えば、一貫性の原則は、ユーザが予期しづらいようなインタフェースの外観や挙動の変更を最小限にすることを求める
  • しかしAIはそもそも一貫したものではなく、タスクや状況の微妙な差から確率的に行動し、学習するにつれて変化する
  • 本内容は、AIデザインに関する20年来の学びを統合して、広く応用可能なhuman-AIインタラクションのガイドラインとしてまとめた

ガイドライン:

(1)利用初期

G1. 何ができるか明確に

  • AIシステムが何をできるものか分かるよう支援する
  • 例)アクティビティ・トラッキング系アプリ「トラックする指標が何で、どのようにトラックするのか示す。指標は1日の歩数、移動距離、運動時間、カロリー消費量など行動指標も含む」

G2. どのぐらい上手くやれるかを明確に

  • AIシステムがどれぐらい間違うかがわかるよう支援する
  • 例)音楽リコメンド「『貴方が好きそうな曲』というように、やや断定を避けた表現」

(2)インタラクション中

G3. 文脈に応じてサービスを調整

  • 現在のユーザのタスク・環境に応じて介入や振る舞うタイミングを調整する
  • 例)ナビゲーション「僕の経験だと、このアプリはタイムリーにルートのガイダンスをくれる。なぜならマップが現在地に応じて更新されるので、ガイドがタイミングにあってる」

G4. 状況にマッチした情報提示

  • 現在のユーザのタスク・環境に関連した情報を提示する
  • 例)ウェブ検索「見たい映画を探していたら、近くでやってる上映スケジュールも合わせて出ていた」

G5. ユーザの常識にあわせて

  • ユーザの社会的・文化的な文脈を考慮しながら、ユーザの期待にあうような体験が届けられるようにする
  • 例)音声アシスタント「はっきと”Okay”と言ってから次の質問をするなど、セミフォーマルな発話をつかう」

G6. バイアス回避

  • AIシステムの言動が、望まれない不公平な偏見を強いるものにならないように
  • 例)Eコマース「オートコンプリートのサジェスト中に、きちんと両方のジェンダー(男女)に向けたものになっている」

(2)AIが間違えた時

G7. 呼び出しやすい

  • AIシステムのサービスを、必要な時に簡単に呼びだ出せるようにする
  • 例)音声アシスタント「初めからやり直せるよう、(途中で)ア○クサと言えるように」

G8. 無視しやすい

  • AIシステムから望まないサービスを受けた時に無視しやすいように
  • 例)Eコマース「機能は出しゃばらず、スクロールダウン下で(below the fold)、簡単にスクロールして飛ばせるような…無視しやすいように」

G9. 訂正しやすい

  • AIシステムが間違った時に、編集、改善、正常に戻しやすい
  • 例)音声アシスタント「私のリマインダー指示が処理されたら、それが編集できるとわかった。下線がついた小さな文字で『タップして編集』で、選択した何か起きると矢羽が示唆していた」

G10. 自信がないときはサービスの範囲を狭める

  • ユーザの目的が不確かな時は、曖昧さの解消に向かうか、丁寧にAIサービスの期待値を下げる
  • 例)オートコンプリート「ダイレクトにコンプリートしにいくのではなく、常に3~4つの候補をサジェストする」

G11. なぜこうしたのかを明確に

  • なぜAIシステムがこういう挙動をしたかの説明にアクセスできるように
  • 例)ナビゲーション「選ばれたルートは”最速ルート”として選ばれたものだと、サブテクストに示されていた」

(3)利用の経過につれて

G12. 最近のインタラクションを覚えておく

  • 短期メモリを維持して、ユーザに参照しやすくしておく
  • 例)ウェブ検索「検索エンジンがクエリーの文脈を覚えてるから、続いて検索できる(例えば、ベンジャミン・ブラット(俳優)が出てきた検索の後で『彼の結婚相手は誰』と出る)」

G13. ユーザ行動から学ぶ

  • ユーザ行動から徐々に学んで体験をパーソナライズする
  • 例)音楽リコメンド「リストに曲を追加する度に、それがトリガーとなって新しいおすすすめがされるから(こうなってる)と思う」

G14. 更新や変更は慎重に

  • AIシステムの挙動を更新・変化させる時は、破壊的な変化にならないよう制限する
  • 例)音楽リコメンド「楽曲を選んだら、下に出てる次の曲リストが更新されるけど、上の一つだけは常に維持されてる」

G15. 細かなフィードバックを推奨

  • AIシステムとの定常的なインタラクションの中でも、ユーザが自分の好みをフィードバックできる
  • 例)Eメール「AIが以前から’重要’マークをつけてないものでも、ユーザが自分でつけられる」

G16. アクションの結果を伝える

  • ユーザのアクションが今後のAIシステムの挙動にどう影響するかを即座に伝える
  • 例)SNS「ある広告を非表示したら、今後の広告表示がどう調整されるのか教えてくれる」

G17. グローバルコントロールできるように

  • AIシステムが何をモニターしてどう振る舞うかをグローバルにカスタマイズできるようにする
  • 例)写真編集「ローケーションヒストリーをオンにできるので、AIが自分がいた場所で写真を分類してくれる」

G18. 変化したことを通知する

  • AIシステムが機能追加したり更新した場合は、ユーザに伝える
  • 例)ナビゲーション「重要な新機能には、小さくアプリ内にコールアウト(注意喚起の記号など)が出る。注意が求められるような新しい機能はポップアップする」

(出展)Guidelines for Human-AI Interaction (Microsoft Research Blog) 
※一部論文も参照