言葉が生まれる瞬間に立ち会う
――私がPicture Descriptionに行き着いた理由
日本の英語教育の現場に立って十数年、私はずっと一つの大きな壁と向き合ってきました。それは、生徒たちに英語の知識がないという壁ではありません。むしろ、多くの生徒たちは真面目です。単語テストに向けて一生懸命覚え、文法問題集を何周も解き、関係代名詞や仮定法の説明を聞けば、ノートにきれいにまとめることができます。定期考査では高得点を取り、模試でも文法問題を正確に処理できる。日本の教室には、そういう努力家の生徒がたくさんいます。
しかし、いざ一枚の写真を見せて「What can you see?」「Tell me about this picture.」と尋ねた瞬間、空気が変わります。頭ではわかっているはずなのに、言葉が出てこない。目の前には人がいる。犬がいる。子どもが走っている。空は青い。テーブルの上に本がある。そんなことは日本語なら一瞬で言えるのに、英語になると急に沈黙が生まれる。私はその沈黙を、何度も教室で見てきました。
「知識はあるのに、話せない」。この言葉は、日本の英語教育を批判するための単純なスローガンではありません。むしろ、現場で努力している教師と生徒が、長い時間をかけてぶつかってきた構造的な課題です。生徒たちは怠けているわけではありません。教師が何もしていないわけでもありません。問題は、英語を「知っている状態」から、英語を「その場で使える状態」へ移すための練習設計が、十分に日常化されてこなかったことにあります。
私が力を入れてきたPicture Description、つまり写真やイラストを見て英語で描写する活動は、この壁を突破するための実践です。それは単なるウォームアップではありません。単なる楽しいゲームでもありません。私にとってPicture Descriptionは、知識として眠っている英語を、呼吸する言葉へ変えるためのトレーニングです。生徒の中にある単語、文法、発音、推測力、観察力、想像力を一気に結びつけ、「あ、英語って今ここで使えるんだ」と気づかせる活動なのです。
1. 文法を知っていることと、情景を英語にすることは違う
多くの日本人学習者は、英語を話すときに頭の中でまず日本語の文を作ります。「男の子が公園で走っています」と考え、それを「男の子=a boy」「走っている=is running」「公園で=in the park」と分解し、最後に英語の語順に並べ替えようとします。この方法は、紙の上で時間をかけて英作文をする場合にはある程度機能します。しかし、実際のコミュニケーションでは遅すぎます。相手の表情は変わり、会話は進み、言いたかったことは次の瞬間には古くなってしまうからです。
スピーキングに必要なのは、翻訳の速さではありません。目で見たもの、感じたこと、頭に浮かんだ概念を、できるだけ直接英語の形へ変換する力です。たとえば一枚の写真を見て、最初に「男の子が走っている」と日本語で考えるのではなく、視線が男の子を捉えた瞬間に “A boy is running.” と英語のまとまりが立ち上がる。この状態を作るには、知識を何度も使い、処理を自動化していく必要があります。
第二言語習得の分野では、知識が実際の技能として使えるようになるには、意味のある練習を通して処理が速くなり、意識的なルール検索に頼らなくなる過程が重要だと考えられてきました。DeKeyserらの技能習得理論は、宣言的な知識、つまり「知っている知識」が、練習を通して手続き化され、より自動的に使えるようになる過程を説明しています。これはスポーツや楽器と同じです。フォームを説明できることと、試合中に自然に体が動くことは違います。英文法も同じで、現在進行形を説明できることと、目の前の動作を見て瞬時に “She is cooking.” と言えることは別の能力なのです。
Picture Descriptionは、この「知識から技能へ」の橋渡しをします。写真の中には、主語になる人や物があります。動作があります。場所があります。形、色、数、位置関係、感情、推測できる背景があります。つまり、一枚の画像は、英語を話すための素材をすでに豊かに含んでいます。生徒はゼロから話題を作らなくてよい。目の前の情報を頼りに、知っている英語を取り出し、つなぎ、声に出せばよいのです。この「話す内容が目の前にある」という安心感が、発話の第一歩を支えてくれます。
2. 2015年、ニューヨークの美術館で見た『言葉が生まれる場』
私がPicture Descriptionの可能性を強く意識するようになった原点の一つに、2015年の経験があります。外務省の若手英語教員米国派遣事業に参加した際、私はニューヨークの美術館を訪れる機会がありました。そこで、学芸員の方が小学生たちを連れて作品鑑賞ツアーをしている場面に出会いました。
私は横から、そのやり取りをじっと観察していました。学芸員は作品の解説を一方的に始めるのではありませんでした。まず子どもたちに問いかけたのです。“What can you see in this work?” 作品の中に何が見える? このシンプルな問いが、子どもたちの目を一気に開かせました。子どもたちは、正解を探すというより、見えたものを次々に言葉にしていきました。「人がいる」「暗い色がある」「悲しそう」「何かを待っているみたい」「後ろに小さな家がある」。彼らは作品を見ながら、自分の観察を自分の言葉で外に出していました。
そのとき私は、強い衝撃を受けました。ここで起きていることは、単なる美術鑑賞ではない。子どもたちは、絵を見ることを通して、観察し、推測し、根拠を持ち、他者の発言を聞き、自分の見方を更新している。そして、そのすべてが言葉を通して行われている。つまり、絵は沈黙した教材ではなく、言葉を引き出す装置なのだと感じたのです。
この経験は、私の中に一つの問いを残しました。もし絵や写真が、母語の子どもたちからこれほど自然に言葉を引き出すなら、英語学習者にも同じことが起こせるのではないか。むしろ、日本のように教科書本文や文法問題に強く依存しがちな環境だからこそ、文字のない視覚情報を使うことで、生徒の発話をもっと自由に引き出せるのではないか。絵の中に答えがあるのではなく、絵を見た学習者の中に言葉が生まれる。その瞬間を教室で作りたい。これが、私がPicture Descriptionに本気で向き合い始めた大きなきっかけでした。
3. 視覚情報は、日本語を経由しない『概念化』を促す
Picture Descriptionの強さは、視覚情報が文字情報とは違う形で脳に入ってくる点にあります。英文を読ませる活動では、生徒は最初から英語の文字列に向き合います。そのため、どうしても「これは現在完了だ」「このthatは関係代名詞だ」「この単語の意味は何だ」と分析的に処理しがちです。もちろん、そのような学習も重要です。しかし、スピーキングに必要なのは、分析だけではありません。見える世界を意味として捉え、それを言葉にする過程です。
人が話すとき、頭の中では大まかに、何を言うかを考える段階、言語形式に組み立てる段階、音として出す段階が連続して働いていると考えられています。Leveltの発話産出モデルでは、概念化、形式化、調音という流れが重視されます。ここで大切なのは、話す前に必ず「言いたい意味」が存在するということです。文法はその意味を形にするための道具です。ところが日本の英語教育では、しばしば道具の練習が先に来すぎて、「そもそも何を言いたいのか」を瞬時に立ち上げる練習が不足します。
写真やイラストは、この概念化の段階を強力に支えます。生徒は文字を読む前に、まず見る。見ることで、人物、物、場所、動作、雰囲気、感情、関係性を捉える。そこから “A girl is looking at a map.” “There are two cups on the table.” “The man looks tired.” のように、意味を英語の形へ変えていく。このとき、生徒は日本語訳の問題を解いているのではありません。目の前の世界を、英語で切り取る練習をしているのです。
Paivioの二重符号化理論やMayerのマルチメディア学習理論も、言葉とイメージを結びつける学習の強さを示してきました。人は言語情報だけでなく、視覚情報も使って理解し、記憶し、取り出します。写真描写では、画像が意味のアンカーになります。単語だけを覚えるよりも、犬が走っている絵を見ながら “The dog is running.” と言うほうが、語彙、文法、発音、状況が一つに結びつきます。英語が抽象的な記号ではなく、目の前の世界を表す生きた道具になるのです。
4. Output Hypothesis:話すからこそ、自分に足りないものが見える
英語を話せるようになるには、インプットが不可欠です。多くの英語を聞き、読み、表現に触れることなしに、自然な英語は身につきません。しかし、インプットだけでは十分ではありません。生徒が実際に英語を口に出そうとした瞬間、初めて自分の中にある穴が見えます。「犬はdogと言える。でも、犬が何かをくわえているって何て言うんだろう」「女の人が立っているは言える。でも、腕を組んでいるは言えない」「There is と There are はどっちだっけ」。この気づきが、学習を前に進めます。
SwainのOutput Hypothesisは、言語を産出することが学習者に気づきを与え、仮説検証を促し、言語形式への意識を高めると説明します。つまり、話すことは単なる確認テストではありません。話そうとすること自体が学習です。言えなかった瞬間に、必要な表現がはっきりする。うまく言えた瞬間に、その表現が自分のものになる。友達の発話を聞いて、「あ、そう言えばいいのか」と新しい言い方に出会う。Picture Descriptionは、このアウトプットによる学習を非常に起こしやすい活動です。
なぜなら、写真には言うべきことが無数にあるからです。たとえば公園の写真なら、最低限 “There is a boy.” と言える。少しできる生徒なら “A boy is playing soccer in the park.” と言える。さらに発展すれば “A boy wearing a blue T-shirt is kicking a soccer ball while his friends are watching him.” と言える。同じ画像でも、学習者のレベルによって発話の深さを変えられるのです。
この活動では、正解は一つではありません。むしろ、見えたものをどう切り取り、どの順番で、どの表現を使って話すかに個性が出ます。だからこそ、生徒は「間違えたら終わり」というテストの緊張から少し解放されます。最初は単語だけでもよい。次に二語、三語のまとまりにする。やがて文になる。文がつながり、説明になる。この小さな成功の積み重ねが、英語を口に出す心理的な壁を下げていきます。
5. Picture Descriptionは、流暢性を育てる最短距離である
日本の英語教育では、正確さが重視されてきました。もちろん正確さは大切です。しかし、正確さだけを追い求めると、生徒は話す前に自分の英語を検閲し始めます。「三単現のsを忘れたらどうしよう」「前置詞が違うかもしれない」「発音が変だと思われるかもしれない」。その結果、沈黙が生まれます。英語を話す活動なのに、話す前の不安が大きくなりすぎるのです。
流暢性とは、完璧な英語を高速で話すことではありません。今持っている英語を、必要な場面で、途切れすぎずに使える力です。Nationの言語学習における四つのストランドでは、意味重視のインプット、意味重視のアウトプット、言語形式重視の学習、そして流暢性育成がバランスよく必要だとされています。Picture Descriptionは、この中でも意味重視のアウトプットと流暢性育成を同時に実現しやすい活動です。
なぜなら、写真は毎回違うからです。生徒は同じ文を機械的に暗唱するのではなく、目の前の画像に合わせて言葉を選びます。しかし、使う構造には反復があります。“There is/are…” “A person is …ing.” “It looks like…” “On the left, …” “In the background, …” “Compared with the first picture, …” のような表現が、画像を変えながら何度も使われます。この「意味は新しいが、型は繰り返される」という状態が、流暢性の育成に非常に合っています。
生徒は最初、たどたどしく話します。単語を探し、文の途中で止まり、同じ表現を繰り返します。しかし、それでよいのです。繰り返すうちに、“There is” が考えなくても出るようになる。“is wearing” が人の服装を見た瞬間に出るようになる。“next to” や “behind” が位置関係と結びつくようになる。こうして、英語が少しずつ口の筋肉と視覚認知に結びついていきます。
PicSpeakでWPM、つまりWords Per Minuteを可視化しているのは、この流暢性を学習者自身に意識してほしいからです。点数だけでは、生徒は「合っているか、間違っているか」に意識を奪われます。しかしWPMが表示されると、「前よりも止まらずに話せた」「今日はたくさん英語を口に出せた」という成長が見えます。流暢性は根性論では育ちません。見える化され、繰り返され、少しずつ更新されることで育つのです。
6. PicSpeakという形にした理由:先生一人の情熱を、全国の教室へ
私はPicture Descriptionの力を現場で何度も感じてきました。普段は英語を話すことに消極的な生徒が、写真を見た瞬間に “There is a cat!” と言う。友達が “The cat is under the chair.” と続ける。別の生徒が “It looks sleepy.” と付け加える。教室の中に、小さな英語の連鎖が生まれる。私はその瞬間が好きです。英語がテストのための記号ではなく、人と人をつなぐ音になる瞬間だからです。
しかし同時に、私は限界も感じていました。Picture Descriptionを継続的に行うには、画像を準備し、レベルに合わせてターゲット表現を考え、発話を聞き取り、フィードバックし、言えた表現と言えなかった表現を整理する必要があります。これは教師にとって大きな負担です。情熱のある先生ほど頑張りすぎてしまう。けれど、活動が先生個人の努力だけに依存している限り、全国の学校へ広げることは難しい。
そこで私は、Picture Descriptionの理論と実践をデジタルツールとして形にしたいと考えました。それがPicSpeakです。PicSpeakは、写真やイラストを見ながら英語で描写し、その発話をリアルタイムで認識し、学習者に即時フィードバックを返すアプリケーションです。目指したのは、単なるスピーキング練習アプリではありません。私が教室で大切にしてきた「見る、気づく、言う、言えなかったことを練習する」という学習の流れを、誰でも、どこでも、楽しく回せる環境です。
PicSpeakの中心には、三つの柱があります。第一に、発話を単語の羅列としてではなく、写真の中のモノや人であるTargetと、その状態や動作であるStateの二軸で捉えること。第二に、WPMによって流暢性を可視化すること。第三に、学習者が詰まったときに、答えを丸ごと与えるのではなく、次の一歩を支えるSupport Modeを用意することです。この三つは、私の現場経験と学習理論を結びつけたPicSpeakの核です。
7. Target × State:
英語の語順を、体で覚える
PicSpeakでは、学習者の発話を単純に「キーワードを言えたかどうか」だけで判定しません。写真の中にあるモノや人、つまりTargetと、その状態や動作であるStateが、英語らしい順序で結びついているかを重視します。なぜなら、英語のスピーキングにおいて重要なのは、単語を知っていることだけではなく、それらを英語の語順で組み立てることだからです。
たとえば、画像の中に「女の子が本を読んでいる」場面があるとします。生徒が “girl” “book” “read” と単語を言えたとしても、それだけでは発話としては不十分です。PicSpeakが目指すのは、“A girl is reading a book.” のように、主語、動作、目的語が自然につながる状態です。
画面上のプログレスバーが進み、ピンが落ち、“FOUND!” や “PERFECT!” と表示される。すると生徒は、「この言い方で伝わった」「この順番で言えばよいのだ」と感覚的に理解します。英語は、基本的に誰が何をするのかを早く示す言語です。このリズムを何度も体験することで、生徒は日本語の語順から少しずつ離れ、英語の構造で世界を見る練習をしていきます。
8. Support Mode:
答えを教えるのではなく、一歩先へ連れていく
Picture Descriptionは自由度が高い活動ですが、その自由さは時に不安にもなります。何を言えばよいかわからない。言いたいことはあるけれど単語が出てこない。この状態で放置されると、生徒は「やっぱり自分は話せない」と感じてしまいます。
PicSpeakのSupport Modeは、ヴィゴツキーの発達の最近接領域、いわゆるZPDの考え方に基づいています。学習者が言葉に詰まっているとき、画像の該当箇所に次に言うべきキーワードがふわっと浮かび上がります。たとえば、犬の近くで止まっている生徒には “dog” や “running” のヒントが出る。場所を表す表現で困っているなら “under” “next to” “behind” のような語が支えになる。完全な文を丸ごと提示するのではなく、発話のきっかけを渡すのです。
この支援は、心理的安全性にもつながります。生徒は「詰まっても助けがある」と感じられる。教師も「全員を同時に見なければならない」という負担から少し解放される。簡単すぎず、難しすぎない、そのちょうど間にある挑戦を、PicSpeakはSupport Modeで作ろうとしています。
9. 5つのゲームモードに込めた学習設計
PicSpeakには、目的に応じた五つのゲームモードがあります。これは単に飽きさせないためのバリエーションではありません。それぞれが、異なるスピーキング能力を鍛えるように設計されています。
📸 SNAPSHOT
一枚の写真をじっくり観察し、見えるものをできるだけ詳しく英語にします。初心者は色、数、モノの名前から始め、上級者は登場人物の感情や背景にあるストーリーまで推測する。観察を言語へ変える基礎体力を育てます。
📖 STORY
複数の写真を順番に見ながら出来事を語るモード。“First,” “Then,” “After that,” “Finally,” のような接続表現を使い、出来事を順序立てて話す。これは英検や入試、プレゼンテーションに直結する、英語で物語る力の土台です。
⚡ PIC FLASH
瞬発力を鍛えるモードです。画像が次々に表示され、瞬間的に反応します。完璧な長文よりも、素早く英語を取り出すことが大切です。語彙の引き出しを開けるスピード(Mental Lexicon)を反射的に高めるトレーニングです。
🧩 MOSAIC
推測表現を引き出すモードです。最初はモザイクがかかり、“It looks like…” “Maybe…” “I think…” と言いながら少しずつ画像の正体に迫ります。不確かな状況で、英語を使って仮説を立てていく実用的な力を養います。
🕵️♂️ DETECTIVE
間違い探しを通して比較表現を鍛えるモードです。二枚の似た絵を見比べ、「上の絵では男の子が帽子をかぶっているが、下の絵ではかぶっていない」のように違いを説明します。“In the first picture…” “but” “different from” などの論理構造を自然に育てます。
10. 小学生・中学生・高校生、それぞれに必要なPicture Description
Picture Descriptionの良さは、同じ活動を発達段階に応じて調整できる点にあります。小学生にとって大切なのは、英語を口に出すことへの抵抗感を下げることです。“I see a dog.” “It is red.” “Two cats.” こうした短い表現で十分です。画像を見て、声に出し、反応が返ってくる。その成功体験が、英語への前向きな感情を育てます。
中学生には、現在進行形、There is/are、前置詞、代名詞、形容詞など、学校で学ぶ文法を実際の意味の中で使う場が必要です。教科書で “He is playing tennis.” を学んでも、それを自分の目で見た画像に対して使わなければ、文法はテスト用の知識に留まります。Picture Descriptionでは、“A boy is playing tennis.” “The bag is under the desk.” のように、文法が生きた表現として使われます。
高校生には、より複雑で深い描写が求められます。関係代名詞を使って “The woman who is standing near the door is holding a phone.” と言う。接続詞を使って因果関係を述べる。推測表現を使って状況を読み取る。高校生にとってPicture Descriptionは、単なる基礎練習ではなく、英語で考えを構成する高度なトレーニングになります。
重要なのは、どの段階でも「見えるものから始める」ことです。英語が苦手な生徒でも、写真の中に何があるかはわかります。そこから一語でも言えれば、学習は始まります。一つの教材で、幅広いレベルの学習者に対応できる。これは、学校現場において非常に大きな強みです。
11. リザルト画面は、失敗を終わりにしないためにある
スピーキング活動で最ももったいないのは、話して終わりになることです。生徒は頑張って英語を話した。しかし、何が言えて、何が言えなかったのかが残らない。結果として、活動は楽しかったけれど、次に何を伸ばせばよいのかが曖昧になることがあります。
PicSpeakでは、発話後のリザルトを重視しています。総合達成度、総単語数、WPM、フルトランスクリプトを表示し、学習者が自分の発話を振り返れるようにします。話している最中には気づかなかった癖が見える。言えているつもりだった単語が抜けていることに気づく。逆に、思ったよりたくさん話せていたことに驚くこともあります。
さらに、言えた表現と言えなかった表現をカテゴリ別に整理します。モノ、状態、動作、位置、推測、比較などに分けることで、生徒は自分の弱点を具体的に理解できます。「私は名詞は言えるけれど、動作が弱い」「場所を表す前置詞が苦手」。弱点が見えると、練習の方向が明確になります。
そして、言えなかった表現には発音練習の機能を用意しています。お手本の音声を聞き、自分で言い、合格判定が出るまで繰り返す。これは罰ではありません。言えなかったことを、次に言えるようにするための橋です。失敗を記録して終わるのではなく、失敗を次の成功の入口に変える。私は、この循環こそが学習アプリに必要な思想だと考えています。
12. Picture Descriptionは、英語教育を『評価』から『成長』へ戻す
私がPicture Descriptionに力を入れる理由は、スピーキング力を伸ばしたいからだけではありません。もっと根本的には、英語学習の経験を変えたいからです。多くの生徒にとって、英語は評価される科目です。もちろん評価は必要です。しかし、評価だけが前面に出ると、生徒は英語を使う前に怖くなります。
Picture Descriptionでは、まず「言ってみる」ことから始まります。完璧でなくてもよい。見えたものを言う。友達の言葉を聞く。もう一文足す。少し詳しくする。違う表現を試す。こうしたプロセスの中で、英語は少しずつ自分のものになります。評価は、学習者を選別するためではなく、成長を支えるために使われるべきです。PicSpeakのスコアやWPM、FOUNDのエフェクト、リザルト分析は、そのための形成的フィードバックです。
私は、教室で生徒の目が変わる瞬間を何度も見てきました。最初は小さな声で “dog” と言うだけだった生徒が、数分後には “The dog is running in the park.” と言う。友達に刺激されて “The dog looks happy.” と付け足す。たった一枚の写真から、教室に英語の連鎖が生まれる。そこには、正解を当てるだけの英語とは違う、生きた学びがあります。
私がPicSpeakで全国の学校や生徒に届けたいのは、この瞬間です。英語が得意な生徒だけが話す授業ではなく、英語が苦手な生徒も一語から参加できる授業。教師が一方的に説明する時間だけでなく、生徒自身が見て、考えて、言葉を生み出す時間。テストのためだけではなく、世界を英語で捉え直すための学び。Picture Descriptionは、その入口になります。
13. 言葉が生まれる瞬間を、すべての教室へ
一枚の写真には、無数の英語が眠っています。人がいる。動きがある。色がある。場所がある。感情がある。物語がある。まだ言葉になっていない意味が、画面の中で学習者を待っています。Picture Descriptionとは、その意味に学習者自身が気づき、自分の英語で取り出していく活動です。
私たちは、英語をもっと人間的なものとして教えることができます。文法を否定する必要はありません。単語学習を軽視する必要もありません。むしろ、それらを本当に使える力に変えるために、写真描写が必要なのです。文法は、目の前の世界を説明するためにある。単語は、自分の見たものを誰かに伝えるためにある。発音は、自分の声を相手に届けるためにある。そう感じられたとき、英語学習は暗記から表現へ変わります。
PicSpeakは、私の現場での問いから生まれました。なぜ、生徒は知識があるのに話せないのか。どうすれば、日本語に翻訳する前に英語が立ち上がるのか。どうすれば、失敗を恐れずに声を出せるのか。どうすれば、先生一人の努力に頼らず、全国の教室で継続できるのか。その問いに対する、私なりの答えがPicSpeakです。
私は、Picture Descriptionが日本の英語教育にもっと広がるべきだと本気で信じています。なぜなら、それは特別な才能を持った生徒だけの活動ではないからです。小学生も、中学生も、高校生も、大人も、一枚の写真を前にすれば、何かを感じます。何かを見つけます。そして、支えがあれば、それを英語で言うことができます。
言葉が生まれる瞬間は、いつも小さいものです。
最初の一語。最初の短い文。
少し勇気を出した推測。友達の表現をまねした一文。
その小さな瞬間が積み重なって、「私は英語で伝えられる」という感覚が育ちます。PicSpeakが全国の学校で、その瞬間を一つでも多く生み出すことができたら、これほど嬉しいことはありません。
英語は、紙の上だけにあるものではありません。教室の中にも、写真の中にも、生徒の目の中にもあります。私たち教師の役割は、その英語が声になる瞬間に立ち会い、そっと背中を押すことです。Picture Descriptionは、そのための最もシンプルで、最も力強い方法の一つです。そしてPicSpeakは、その実践を誰でも始められる形にした、私の教育への挑戦です。
References
- DeKeyser, R. M., & Criado, R. (2013). Automatization, Skill Acquisition, and Practice in Second Language Acquisition. The Encyclopedia of Applied Linguistics.
- Levelt, W. J. M. (1989). Speaking: From Intention to Articulation. MIT Press.
- Mayer, R. E. (2002). Multimedia learning. Psychology of Learning and Motivation, 41, 85-139.
- Nation, P. (2007). The Four Strands. Innovation in Language Learning and Teaching, 1(1), 2-13.
- Paivio, A. (1986). Mental Representations: A Dual Coding Approach. Oxford University Press.
- Swain, M. (1985/1995). The Output Hypothesis and second language learning.
- Vygotsky, L. S. (1978). Mind in Society: The Development of Higher Psychological Processes.
- Koizumi, R. (2022). Assessing functional adequacy using picture description tasks with Japanese learners of English. JLTA Journal, 25, 60-79.