アメリアという有料会員制の翻訳者向けサイトがあるのですが、そこで翻訳の練習のために公開されている課題文の著作権がCC4.0ライセンスだったので、課題文と訳と手本訳をみて修正をどんなふうに入れて翻訳力を向上できるように活かしているかを公開します。予定では三ヶ月ほど週5日ほどこの方法で勉強して、そこで有料の翻訳課題を受けて、評価がB以上つけば翻訳会社を受ける、評価がCならば翻訳家は諦めて、他の仕事をしながら英語の勉強を趣味で続けたいと思っています。ちなみに上の画像は文章の中に出てくるGPTを用いたチャットで私が入力した内容にAIが答える様子のスクリーンショットです。携帯電話番号の登録が必要ですが誰でも利用出来るので興味のある方はOpenAIのホームページで試してみてはいかがでしょうか。こういう新しい技術を知れる事がIT翻訳の面白さですね。仕事にするとなるとそうはいかないかもしれませんが。
課題文
“What’s past is prologue.” So says the famed quote from Shakespeare’s The Tempest, alleging that we can look to what has already happened as an indication of what will happen next.
This idea could be interpreted as being rather bleak; are we doomed to repeat the errors of the past until we correct them? We certainly do need to learn and re-learn life lessons—whether in our work, relationships, finances, health, or other areas—in order to grow as people.
Zooming out, the same phenomenon exists on a much bigger scale—that of our collective human history. We like to think we’re improving as a species, but haven’t yet come close to doing away with the conflicts and injustices that plagued our ancestors.
Zooming back in (and lightening up) a little, what about the short-term future? What might happen over the course of this year, and what information would we use to make educated guesses about it?The editorial team at The Economist took a unique approach to answering these questions. On top of their own projections for 2020, including possible scenarios in politics, economics, and the continued development of technologies like artificial intelligence, they looked to an AI to make predictions of its own. What it came up with is intriguing, and a little bit uncanny.
An AI That Reads—Then Writes
Almost exactly a year ago, non-profit OpenAI announced it had built a neural network for natural language processing called GPT-2. The announcement was met with some controversy, as it included the caveat that the tool would not be immediately released to the public due to its potential for misuse. It was then released in phases over the course of several months.
GPT-2’s creators upped the bar on quality when training the neural net; rather than haphazardly feeding it low-quality text, they only used articles that got more than three upvotes on Reddit (admittedly, this doesn’t guarantee high quality across the board—but it’s something).
The training dataset consisted of 40GB of text. For context, 1GB of text is about 900,000 ASCII pages or 130,000 double-spaced Microsoft Word pages.
Copyright (c) The Author(s) 2020
Vanessa Bates Ramirez“This Is What an AI Said When Asked to Predict the Year Ahead” https://singularityhub.com/2020/02/13/this-is-what-an-ai-said-when-asked-to-predict-the-year-ahead/ The text in this work is licensed under a Creative Commons Attribution 4.0 International License. creativecommons.org/licenses/by/4.0
試訳
「過去に起こったことは、序章である。」 シェイクスピア作の戯曲テンペストからの有名な引用はそう述べて、すでに起こったことを次に起こることの兆候とみることが可能なことを示唆している。
この見解はかなり希望のないように解釈できるかもしれない。我々は誤りを正すまでは過去の失敗を繰り返すように運命づけられているのだろうか? 確実なのは、我々は仕事であろうと人間関係、資金繰り、健康、人生の他の側面についても、人として成長するためには、日々の経験への省察をして繰り返し学ぶことが必要だということである。
より離れた視点でみると、同じ現象はより大きな規模でも存在する。つまり人間の歴史についても言えるのである。人類は進歩していると考えたがちであるが、しかし、争いや不正という我々の先祖を苦しめたことを取り除くにはまだほど遠い。少し視点を戻して(明るくして)、短期の将来はどうだろうか? 今年のうちにどんなことが起こるかもしれないだろうか、そして知識に基づく推測をするためにどんな情報が使えるだろうか?
エコノミスト誌の編集班は、これらの質問に答えるためユニークな目標への近づきかたを取っている。2020年に向けたプロジェクトは、政治や経済、人工知能(AI)のような科学技術の発展をにより生じるシナリオを含む。そこで彼ら自身の予測に加えてAIを自らの予測を作るため頼りにしたのだ。予測された将来は興味深くも少し薄気味悪いことであった。
AIまず読み、そして書く
ちょうど一年前頃に、非営利団体「OpenAI」が「GPT-2」と呼ばれる自然言語のためのニューラル・ネットワークを作り上げたと発表した。この発表はいくつかの論争に直面した。そのなかには悪用される脅威があるので、このツールは一般に直接公開してはいけないという警告も含まれていた。その後、数ヶ月のうちに公開の段階に到った。
「GPT−2」の作成者達はニューラル・ネットのトレーニング時に精度の障壁を高め、行き当たりばったりに低い精度の文を読み込ませるのではなく、「Reddit」で3以上の良いねボタンを取得した記事のみを使用した。(確かに、これは障壁を越えて高精度な文である事を保証はしないが、しかし、注目すべきことである。)
トレニーング・データセットは40GBの文字列からなる。ちなみに、1GBのテキストはアスキー文字で作成された約90万ページに相当し、マイクロソフトワードで一行おきに文字入力して作成された13万ページになる。
訳文修正後
「過去に起こったこれまでの
ことは、序章である。」 シェイクスピア作の戯曲「
テンペスト」
からの有名な引用はそう述べて、すでに起こったことを次に起こることの兆候とみることが可能なことを示唆しているこれから起こることを予測できるという考え方が、ここには強く表れている
。
作品名は必ずカッコで囲む
past 終わった、過ぎ去った、これまでの」という叙述的な(= 名詞の前に付くのではない)形容詞で、ここではこの用法で使われている。
alleging that we can look to what allegeは「主張している」を言い換えて「いわんとしているのは〜」「〜という考えが強く表れている」という構文が使える
lookは「過去におきたこと」を「これから起きる事の道しるべとすると続くので、「見なす、考える」という意味がこの文脈では当てはまる。
この見解はかなり希望のないように解釈できるかもしれない。我々は誤りを正すまでは過去の失敗を繰り返すように運命づけられているのだろうか定めなのだろうか
? 確実なのは、我々は仕事であろうと人間関係、資金繰り、健康、人生の他の側面についても、人として成長するためには、日々の経験への省察をして繰り返し学ぶことが必要だということである。
doom は「運命づける」と訳すよりも「定めなのか」と訳したほうが直訳調を避けられる
より離れた視点でみると視野を広げてみると
、同じ現象はより大きな規模でも存在する。つまり人間の歴史についても言えるのである。人類は進歩していると考えたがちであるが、しかし、争いや不正という我々の先祖先人を苦しめたことを取り除くにはまだほど遠い。少し視点を戻して(明るくして気楽にかまえて
)、短期の将来はどうだろうか? 今年のうちにどんなことが起こるかもしれないだろうか、そして知識に基づく推測をするためにどんな情報が使えるだろうか?
zoom outは視野を広げてみるとのほうがわかりやすい
lightenは他動詞のときのみ「明るくして」という意味がある
listen up で「気楽にやる」という意味があるので、気楽に構えてとも訳せる
ancestors を先祖としてしまうと急に個人的な話のようになる、ここは「先人」と訳したい
エコノミスト誌の編集班は、これらの質問に答えるためユニークな目標への近づきかたを取っている。2020年に向けたプロジェクトは、政治や経済、人工知能(AI)のような科学技術の発展をにより生じるシナリオを含む。そこで彼ら自身編集部として
の予測に加えてAIを自らの予測を作るため頼りにしたのだ。予測された
のはAIが弾き出したのは
興味深くも少し薄気味悪いこと答え
であった。
On top of their own projection のtheirは編集部を指している
AIまず読み、そして書く読むだけでなく、自ら文章を書くAI
ちょうど一年前頃に、非営利団体「OpenAI」が「GPT-2」と呼ばれる自然言語のためのニューラル・ネットワークを作り上げたと発表した。この発表はいくつかの論争に直面したいささかの物議。そのなかには悪用される脅威があるので、このツールは一般に直接公開してはいけないという警告も含まれていた。悪用の恐れがあるためすぐには一般公開しないという但し書きがあったためだ。
その後、数ヶ月のうちに公開の段階に到った。をかけて段階的に発表されていた。
An AI That Reads—Then Writesは解釈の可能性が色々あるので、後に続く文章を端的に表した見出しをつける
some controversyはsomeのあとが複数形になってないので「いくつかの」と訳してはダメ
as it included the caveat that the tool itは発表のことで、その中に警告が書かれていたのだから、ここは但し書きがあったと考えられる。
released in phases:phasesと複数系になっているので、段階的に公開されたと考えるべきところ
OpenAIという企業名やGPT-2というソフト名は「」で囲む必要はない
「GPT−2」の作成者達はニューラル・ネットのトレーニング時に精度の障壁品質基準
を高め、行き当たりばったりに低い精度の文を読み込ませるのではなく、「Reddit」で3以上の良いねボタンを取得した記事のみを使用した。(確かに、これは障壁を越えて全面的に
高精度な文品質が高い
である事を保証はしないが、~~しかし、注目すべきことである。~~なにがしかの基準になる)
トレニーング・データセットは40GBの文字列からなる。ちなみに参考までに
、1GBのテキストはアスキー文字で作成された約90万ページに相当し、マイクロソフトワードで一行おきに文字入力して作成された13万ページになる。
something はここでは「それなり、ある程度のもの」の意味で使われている
For context 参考までに
across-the-board 「全面的に」の意味。先のbarと勘違いして辞書を十分に引いてない
high qualityを人間が書いた文のことについて述べているので、高精度はおかしい
upped the ı on quality barには障壁という意味があるが、それでは意味がつたわらないので「基準」という言葉に言い換えている
こんな感じにマークダウンのタグだけを使って赤入れをします。もっと訳例に近づけるために直すべきところもあるでしょうが、全部、訳例にしてしまうと、自分の工夫したところも残らなくなってしまうのでこのぐらいで止めておきます。
今日でこういう事を繰り返して3日目になります。翻訳をするときは楽しいけれど、未翻訳に付属している講評にピタリと当てはまる間違いをしていると辛いので、息抜きの日を作りながら進めていきたいと思います。今回の訳は辞書を色々とみたりgoogleの検索結果を見て訳しましたが、それでもまだ調べたりない事が多くて反省です。それと辞書に載ってないような言い回しの訳は難しいですね。あともう少し辞書の訳をそのまま使うんじゃなくて、言い回しを変えてみる工夫も必要かもしれません。
尚、未翻訳は高橋 聡先生によるものです、一部、先生の訳した用語をそのまま用いていますが、一般的な用語なので著作権の侵害には当たらないかと思いますが、削除の必要性がある場合はご連絡下さい。