![[改訂新版]プログラマのための文字コード技術入門 (WEB+DB PRESS plusシリーズ) [改訂新版]プログラマのための文字コード技術入門 (WEB+DB PRESS plusシリーズ)](https://m.media-amazon.com/images/I/51vqn-2eVKL.jpg)
[改訂新版]プログラマのための文字コード技術入門 (WEB+DB PRESS plusシリーズ)
- 作者:矢野 啓介
- 発売日: 2018/12/28
- メディア: 単行本(ソフトカバー)
『プログラマのための文字コード技術入門』、いまさらながら読みました。"いまさらながら"というのは、Shift-JISやEUC-JPのあたりで苦しめられたピークは多分10年ほど前だったので… 当時、紀伊国屋かどこかで「文字コードの本って無いですかね…?」「あー、最近あんま無いですよ」って言われて、じゃあいいか…くらいで諦めた記憶がうっすらあります。最近、何かの本を検索しててレコメンドにこれが出てきて、当時を思い出しながら衝動ポチしてしまいました。
感想
当時なんとなくググって理解した気になっていた文字化け問題とかが「あー、そういうことだったのね」と氷塊したり、過去からの文字コードの経緯でへ~~~となったり、なかなか面白かったです。ただ、メールですらUTF-8になってきたこの時代においては、大抵の人は知らなくてもいい知識だろうなあ、という気はしました。若い人からしたら歴史書に近いかもしれませんね…
メモ
nkf
nkfの改行コードオプションこうやって覚えればよかったのか(いまさら) pic.twitter.com/7kzfuRL0ny
— 聖(ひじり)@メルカリで売るだけおじさん (@hijili2) 2020年12月3日
これ。ずっと覚えてなかったんですが、こういうことだったのね…(いまさら中のいまさら
機種依存文字を使わないことはマナー
利用経験の長いみなさんにはマナーですよ。人間関係的な意味でも気を付けろよ🌠 pic.twitter.com/HAwPooNWXx
— 聖(ひじり)@メルカリで売るだけおじさん (@hijili2) 2020年11月30日
人間関係的にも。マナー怖いですね。お気をつけください。
セキュリティ的なやつ
hoge_txt.exe
これね。htmlソース見ると分かるんですけど、文字列的には "foo_txt.exe" って書いてるんですよ。ただし、"_"の後にUncodeの制御文字U+202E(RIGHT TO LEFT OVERRIDE 右から左に書く言語で使うやつ)を差し込むと、ファイル名が "hoge_exe.txt" に見えるっていうね(ブラウザによっては見えないかも?)。はあ~、こんなんあるんや… 最近の攻撃手法として有効なのか分かりませんが、制御文字とか知るとこういうのも分かるようになるんやなと。文字コード深いですわ… マジ高度ですね…(文字とマジは無理がある1スベリ)