Unicode– tag –
-
テクノロジー
UTF-8のBOM付きとBOMなしを変換する方法(Linux)
最近ではあまり意識しなくなりましたが、UTFー8にはBOM(byte order mark)という厄介な存在があります。今回は、LinuxでこのBOMを付けたり外したりする方法をご紹介します。 BOMとは? BOMを簡単に説明すると、そのファイルがUnicodeで符号化されているか... -
テクノロジー
Javaでサロゲートペア文字を置換したり除去する2つの方法
前回、JavaでASCIIの制御文字の取り扱いについて記事にしました。 そして今回は、前回の対策を応用して、もっと厄介なサロゲートペア文字をJavaでゴニョゴニョする方法を2つ程ご紹介したいと思います。 サロゲートペア文字とは? 簡単に説明すると、全世界...
1