前の日 / 次の日 / 最新 / 2023-03

残日録 --- The Remains of the Day / 2023-03-28

2023-03
SMTWTFS
1234
567891011
12131415161718
19202122232425
262728293031

2023-03-28 Tue

ニュース…「「DeepL」が「Microsoft Store」に登場 ~自然な訳文が得られると人気の無料AI翻訳アプリ」---これは便利だ;あたり前だがもとの PDF がきれいでなければ(OCR が正確でなければ)あまり意味はない : [Category SNS]

[Visit Website 窓の杜]  

この記事で紹介されている 翻訳アプリの DeepL、なかなかに便利そうだ。 Chrome の 拡張機能を Chrome にインストールしてみた。 さっそく(オランダ語の)植民地文書を翻訳してみる。 選んだ文書が 5 MB ほどあったので、 アップロード可能の上限 3 MB を越えていた。 まずは、 Kami で読み込むこととする。 Kami には OCR 機能があったので、 それを用いてテキスト化した。 [--DeepL に直接アップロードしても (テキスト化していないので)無駄だったことに気がついた。--]

さて、 Kami 上で PDF ファイルの一部を選択して CTRL-SHIFT-Y で翻訳をしてみる。

うまくいかない。

考えてみれば、当り前である --- もとの文書(植民地文書)が汚ないので、 PDF ファイルも汚ない。 それで OCR がほとんどうまくいっていないのだ。 (たぶん 20 %前後だ) わりとめちゃくちゃなテキストを与えられてしまったので、 DeepL の翻訳も滅茶苦茶になってしまった、というわけだ。 次回はきれいな PDF ファイルを見つけて、 それをつかってみることにしよう。

いまのところ、植民地文書を読むためには、 DeepL の 翻訳窓をつかって、 文章を自力で入力するしかないだろう。 これでもないよりましだろう。

もちろんポルトガル語でもできる筈なので、 こんどいいデータがあったら、試してみることとする。

2025 : 01 02 03 04 05 06 07 08 09 10 11 12
2024 : 01 02 03 04 05 06 07 08 09 10 11 12
2023 : 01 02 03 04 05 06 07 08 09 10 11 12
2022 : 01 02 03 04 05 06 07 08 09 10 11 12
2021 : 01 02 03 04 05 06 07 08 09 10 11 12
2020 : 01 02 03 04 05 06 07 08 09 10 11 12
2019 : 01 02 03 04 05 06 07 08 09 10 11 12
2018 : 01 02 03 04 05 06 07 08 09 10 11 12
2017 : 01 02 03 04 05 06 07 08 09 10 11 12
2016 : 01 02 03 04 05 06 07 08 09 10 11 12
2015 : 01 02 03 04 05 06 07 08 09 10 11 12

最終更新時間: 2025-04-28 11:09

前の日 / 次の日 / 最新 / 2023-03