1/69

沖山 翔

沖山 翔

医師/研究者(情報学)

825views

ヒトゲノム計画に代表されるようにテクノロジーの進歩は指数関数的です。AI、ロボット、VR/AR/MR、BCI/BBIについてわかりやすく説明した後、テクノロジーのもつ性質を歴史を振り返りながら、現在、そして未来へと視点を移しながらみていきます。最後にAntaaで行ったWSの題材についてもご紹介します。

テクノロジーとその性質〜AI, ロボット, VR, BCI

1. テクノロジーとその性質 2017.11.22 沖山 翔
2. “ 21世紀の終わりまでに全ての病気を 治療し、予防し、あらゆる病気に 対応できるようにしたい” –– マーク・ザッカーバーグ CC BY SA, Alessio Jacona, flickr
3. “2030年、あるいは遅くとも 2030年代の終わりまでには、 人類は全ての病気を 乗り越えられるだろう” –– レイ・カーツワイル TED, https://www.youtube.com/watch?v=PVXQUItNEDQ
4. テクノロジーの進歩は指数関数的 100% 80% ヒトゲノム計画 進 (60億USD/15ヶ年) 予定 実際 60% 40% 20% 1% 0% 1997年 ゲノムの解読達成率は1% 多くが計画中止を主張 しかし「 1% 終わったのなら、もう半分終わったに等しい」
5. テクノロジーの進歩は指数関数的 100% 80% ヒトゲノム計画 進 (60億USD/15ヶ年) 予定 実際 60% 40% 20% 0% 1997年 ゲノムの解読達成率は1% 多くが計画中止を主張 しかし「 1% 終わったのなら、もう半分終わったに等しい」
6. 人工知能 (AI)
7. なぜいまAIなのか 大量のデータ クラウド化による大量のデータ ハードウェアの進化 GPUによる並列処理、計算速度の向上 キャッチーな事例 Pepper、アルファ碁 世間からの期待感
8. AIのレイヤー もはや人工知能と呼ばれなくなったもの 人工知能 l 自動ドア 機械学習 ルールベースド l AI in the 1980’s l 「AならばB」 ディープラーニング l MS Officeのイルカ l ルンバ l AlphaGo l 画像認識 汎用人工知能? 現状の 延長線上にはない
9. ディープラーニング これまで 耳が立ってて… 目が2つあって… 現在 鼻は三角で… その下に口が… すべて人が教えていた 機械が勝手に共通点を学習 - ヒゲはあるの?ないの? - 似た写真ごとに分けといて! - 口は何個? - あ、この山が「ネコ」ね。 - あれは?これは? 何をどこまで教えるべきか不明 サンプル数が増えれば個体差は吸収、 平均すると「猫らしさ」が残る
10. 「特徴量」とは これまで ディープラーニング [円]ある点からの距離が [爬虫類]トカゲとね、ワニと 定義できるものは扱える サンプルさえ与えれば、 等しい点の集合 [爬虫類]えー、変温動物で カメとイモリと… 「爬虫類という概念」の抽出は AI任せでOK 足が4本あって… 性質列挙のみでは扱えない 定義しづらい抽象的な概念も 性質のまま(=特徴量)扱える
11. 特徴量の演算 元絵 + https://deepart.io/ 画風 絵の単純な合成ではなく、 “ゴッホらしさ” という 特徴量の取り扱いが可能に
12. あらゆる要素のパラメータ化 構図 配色 筆圧 http://www.adweek.com/, “Inside ‘The Next Rembrandt’ ” レンブラントの新作 (Microsoft, 2016.04) “レンブラントらしさ” を AI が因数分解。それに そってイメージ合成
13. (動画) “Synthesizing Obama: Learning Lip Sync from Audio” https://youtu.be/9Yq67CjDqvw
14. AIのもたらす価値 認識:文章、音声、画像、動画 リスニングの能力は人間を上回る 予測:おすすめ商品、数値予測 過去の傾向から統計推論 最適化:囲碁、自動運転など 最善手を選ぶ
15. http://www.goldmansachs.com/ トレーダーの数:600人 → 2人 - トレーダー職は AI にその地位を譲った - アナリストレポートの「行間を読む力」は人間以上 - 衛星写真の解析:駐車場の利用率、農作物の栽培状況から 投資判断 NYオフィスには200人のAI開発者 リターンは30年前の2-5倍 人間が利活用できないデータで差がつく
16. ロボット
17. ロボットのもたらす価値 自動化 運動・感覚能力の拡張 - 効率化と再現性向上 - 精度と自由度の高い動き - 人間は有事の対応に - 五感の能力増強 - 六番目以降の感覚獲得 操縦式と自走式で異なる用途
18. https://www.intuitivesurgical.com/ ダ・ヴィンチ(操縦式ロボット) - 体力増強:座って手術できる + アームレスト - 視力増強:3D内視鏡 + ズーム視 15倍 - 手が3本に:3本のアームを1人で操れる - 関節機能増強:関節可動域360度 - 神経、筋肉機能増強:自動手ぶれ補正 - 小脳機能増強:モーションスケール(1:5) 道具を超えた、人間の能力増強デバイス
19. http://www.rethinkrobotics.com/ バクスター(自走式ロボット) - 自動学習:はじめに手を取って 課題を教えると次から自走 - 汎用性:プログラミング不要で 多用途 - 2.5万ドル/体:時給300円/365日 平均投資回収期間 < 1年 直感的に教育できる自走ロボット 製造業のコスト構造が変化
20. (動画) “The World's First Robotic Kitchen - TV Commercial” https://youtu.be/BSBTCOEdLkA
21. ロボットの応用可能性 人的リソースの代替 自動化によるコスト削減 ロボットのユーティリティ化も進む 専門技術のコモディティ化(運動能力拡張) 動作に機械のフィルタを通すことで、 再現性や巧緻性が向上 事前情報量の増加(知覚能力拡張) 五感が深まり、温度や磁場など 第六感、第七感を作業に反映 人間の 複製 + 能力共有 + 能力拡張
22. VR, AR, MR
23. VR, AR, MRとは 仮想現実 (Virtual Reality) 現実世界 拡張現実 / 混合現実 (Augmented Reality / Mixed Reality) VR:100% 仮想空間。その場で使うのが前提 AR/MR:現実空間も見える。動きながら体験可能
24. AR(拡張現実) vs MR(混合現実) AR (augmented), MR (mixed) 現実の拡張という立場の AR に対して、 現実、仮想世界の境界のなさを強調したのが MR。 仕組みは同じ、世界観の違い (本資料内では “AR” に統一)
25. 大衆向けモデルはゲームから バーチャルボーイ (VR) 任天堂、1995年 ポケモンGO (AR) Niantic(Googleより独立) 2015年
26. 代表的なVRハード Oculus Rift 2016/3~:Facebookによる買収 (2014, $2B) HTC Vive 2016/4~:ルームスケール機能で部屋をVR空間に PlayStation VR 2016/10~:日本語、低価格、PS4で作動 Google Cardboard 2014/6~:本体はスマホを利用
27. 代表的なARハード Google Glass 2013/2~2015/1: プライバシー懸念から一般販売は中止に Microsoft HoloLens 2016/3~:開発者向けモデルのみ販売 Meta2 2017/7~:開発者向けモデル。90度の広い視野角 Magic Leap(未公表 未発売) プロダクト完全秘匿のまま企業価値は $6B へ
28. ARの核となる技術 現実空間の把握 ダブルカメラ(奥行き認識)、GPS、地磁気センサー、 加速度センサー、ジャイロセンサー AR vs リアルデータの同一座標処理 視線方向が変わっても、 ARデータは現実空間上でそのまま ユーザー行動によるインプット ユーザがとった行動を認識し、 AR空間にフィードバック反映
29. https://wayray.com/ Navion 通常運転時:カーナビ機能、ダッシュボード表示 自動運転時:地域情報の表示、コミュニケーションパネル https://wayray.com/industry/
30. (動画) “SpatialGate & SpatialOrb WIP” https://youtu.be/6D-8kkH1KPE
31. VR, ARのもたらす価値 VR性:時間の操作性 早送りによる時間短縮、時間逆移動によるやり直し VR性:空間の操作性 行けないところへ行ける、すぐに行ける、 対象物の拡大&縮小 AR性:五感(モダリティ)の拡張 センサーやIoTとの連携で 見えないものが「見える」化
32. 小型化の後に起こる質的転換 ディスプレイの変化 1973 1990 2007 1995 2013 ? ??? ・鏡、窓 ・網膜投影 ・コンタクトレンズ ・プロジェクションマッピング ・ホログラム ・BCI モダリティの統合 ・ハプティクス ・BCI デバイスの融合 ・スマホ、PC、テレビ vs 眼鏡、鏡、家具、空間
33. (動画) “Desktopography: Supporting Responsive Cohabitation Between Virtual Interfaces and Physical Objects” https://youtu.be/L5mCxfjk6hc
34. BCI (Brain Computer Interface)
35. Brain Computer Interfaceとは 脳そのものをデバイスとして使う技術 脳へのインプット - 1961年 人工内耳の第一例目 - 1968年 人工網膜の第一例目 脳からのアウトプット - 1998年 サルが思考のみでアームを操作(1,000km遠隔) - 1999年 意思表示ができない患者 脳波による文字会話実現 未来のSF技術ではなく、現在進行形のテクノロジー
36. デバイスの種類 植込み型 装着型 - 頭蓋骨内部に電極 - 手術不要で簡便 - 脳に刺入または表面留置 - 感度低く発展途上 - 弱い脳波も検出可 - 毎回調整が必要
37. (動画) “Brain-Computer Interface allows Fast, Accurate Typing by people with Paralysis | QPT” https://youtu.be/Rma2JDQaY1I
38. 2017年上半期の動き - イーロンマスク創設 (Tesla, SpaceX) - 思考によるタイピング デバイス - 植込み型BCI - 装着型BCI - 「健康人のBCIを10年以内 に実現」 (2017/3) - 「100語/minの機器を 2年で作成」 (2017/4) Google, Microsoft, Intelも社内に BCI 部門を有する イーロンマスクは最終的に人間とAIの融合を見込む
39. 「思考がばれてしまうのでは?」 脳のあらゆる電気的活動 このレイヤーが好き勝手に 出力されるわけではない 思考・意図 論理 命令・指示 「腕を動かせ」 感情 「声を出せ」 「文字を打て」 出力対象はこのレイヤー。 目の前の人を - 腕が勝手に殴ってしまわない - 無自覚に口説いてしまわない のと同じように自制は可能
40. ロボットアームの仕組み 人間語の脳波を機械学習し、機械語に自動翻訳して操作 手よ動け、手よ動け、手 よ動け、手よ動け、手よ 動け、手よ動け、手よ… 手を動かす時の 私の脳波一覧 1. ∼∼ 2. ∼∼ … 慣れれば、念じる 必要すら無くなる
41. 人工内耳、人工網膜 マイクから聴神経、カメラから網膜を刺激 - 視神経や大脳を直接刺激することも可能 「見え方・聴こえ方」は一通りではない - 全盲の人が人工視覚で初めて見る世界は他と同じか? - 盲目の人が反響定位で「見る」世界はどう見えるのか? - 私の感じる「赤」とあなたの「赤」は同じ色か? 世界とインタラクトできれば、他人と違ってもそれは知覚
42. BCIの可能性 身体の機械化 身体的制限の克服 脳と身体の空間的分離 有機物的に非連続な自己。存在という概念の転換 非圧縮 = 1分の1 コミュニケーション 言語というボトルネックのバイパス brain-to-brain interface (BBI) も実例あり 環境ではなく、我々の身体を対象とした改変
43.
44. 未来は既にここにある 均等に行きわたっていないだけだ –– ウィリアム・ギブソン(作家)
45. テクノロジーのもつ性質
46. テクノロジーと科学 テクノロジーとは この世界の科学法則を、人間に役立つ形に変換する技術 CC BY SA 2.0 Fr, Rama 背景には常に科学法則
47. “電気が何の役に立つのか、私には分か りません。ただあなた方(財務省)が 将来それに課税することは確信してお ります” –– マイケル・ファラデー CC BY 4.0, Fæ
48. 基礎研究の場は大学から企業へ 科学法則 テクノロジー 製品 基礎研究 R&D 製品開発 企業内部門の範囲拡大 - 大学の研究室ごと acqui-hire の対象に - 敢えてモントリオールにAI研究所をつくるFacebook社
49. 10,000倍: (対数スケール) CC BY 2.0, Steve Jurvetson
50. Linear vs Exponential linear(線形) exponential(指数関数的) アマラの法則:人は短期的には技術の影響を過大評価し、 長期的にはその影響を過小評価しがちである
51. 直近500年の変化 1500年 vs 現代 世界人口 総生産 消費熱量 14倍 240倍 115倍 5億人 2500億USD 130億kcal/day 70億人 60兆USD 1.5兆kcal/day (『サピエンス全史』 Yuval Noah Harari – 2011年原著) 過去500年の非連続的な変化 そして変化のペースは大幅に加速
52. 世界人口(億人) 8 7 6 5 4 3 2 1 0 いま50歳:世界人口は 40億人 と教わった世代 いま 0 歳:世界人口は 85億人 と教わる世代
53. 判断の誤 携帯電話の市場予測 (2002年相対値) 15 13 11 9 実際 2002予測 7 5 3 1 2002 2004 2006 2008 2010 実際の成長曲線 (YoY+100%) vs コンサル、マーケティングファーム4社の予測 (McKinsey, Gartner, Forrester, Jupiter)
54. 判断の誤 携帯電話の市場予測 (2002年相対値) 15 13 11 9 7 実際 2002予測 2004予測 5 3 1 2002 2004 2006 2008 2010 実際の成長曲線 (YoY+100%) vs コンサル、マーケティングファーム4社の予測 (McKinsey, Gartner, Forrester, Jupiter)
55. 判断の誤 携帯電話の市場予測 (2002年相対値) 15 13 実際 11 2002予測 9 2004予測 7 2006予測 5 3 1 2002 2004 2006 2008 2010 実際の成長曲線 (YoY+100%) vs コンサル、マーケティングファーム4社の予測 (McKinsey, Gartner, Forrester, Jupiter)
56. 判断の誤 携帯電話の市場予測 (2002年相対値) 15 13 11 9 7 5 実際 2002予測 2004予測 2006予測 2008予測 3 1 2002 2004 2006 2008 2010 Exponential な成長を見ても、予測は linear のまま
57. Exponential な性質はどこから来るのか (T: technology M: money P: people) - テクノロジーがテクノロジーを進歩させる - 正の循環構造 産業革命の源泉は何か - 蒸気機関、ではなく、石炭 → 蒸気機関 → 石炭の 循環構造 - 石炭生産量:300万トン/年 (18世紀) → 1億トン/年 (19世紀) ポジティブフィードバックが
58. “Thinking beyond the rules” 日本人の平均寿命(過去50年) 90 85 80 75 70 65 男性 女性 - 寿命に壁はあるか? - 人類は100m走で9秒を切れるか?8秒は切れるか?
59. (動画) “The Fitness Model Without a Pulse” https://youtu.be/gNUATS8Jhuk
60.
61. 未来は正確に予測できない +10% 基準 -10% ×3.0 ×3.0 月1割の予測誤差 = 2年で3倍の誤差。Exponential なものは、 そうと分かっていても時期と規模の予測が困難
62. 予測できないものへの対処法 Linear かつ 予測不能なもの - どれが伸びるか不明のため解無し - コストもリターンも linear であり、ギャンブル Exponential かつ 予測不能なもの - ポートフォリオ化すれば、どれかが伸びる - コストは linear だが、リターンは exponential 投資の経済合理性がある = GAFAが全てに手を出す理由 テクノロジーを 早く、広く押さえる ことの価値
63. https://www.weforum.org/ 正確な予測は誰にもできない
64. 誰しも自分の想像力の限界が、 世界の限界だと誤解する –– ショーペンハウアー(哲学者)
65. 後半編はワークショップ!! 未来の医療を妄想しましょう 未来ブログ http://okiyamasho.com
66. (動画) “TastyFloats: A Contactless Food Delivery System” https://youtu.be/PcuABIJtSyQ
67. (動画) “ロボネコヤマト 4/17より試験サービス開始” https://youtu.be/KmT_DJgM1Z8
68. (動画) “PAY PER LAUGH -The CYRANOS McCANN Woldgroup Europe Barcelona Cannes Lions 2014 Winner” https://youtu.be/V0FowbxEe3w
69.