[スレッド全体]

[8005] Re:文字コード誤認識でしょうか?返信 削除
2015/3/5 (木) 23:00:50 もか
Mozilla/5.0 (Windows NT 6.1; WOW64; rv:36.0) Gecko/20100101 Firefox/36.0
> +G10)
まず、これはUTF-7として正しい文字列です。ですので誤認識ではありません。
Base64の後ろの-は、Base64に含まれない文字列が来た場合省略可能です。

しかし一方で、UTF-7はめったに使われず誤認識する方が有害っぽいので、パッチは作りました。
https://sourceforge.net/p/sakura-editor/patchunicode/988/
・UTF-7で「-」で終わっていないBase64部分をポイント加算しないように
・UTF-7でBOM認識処理を無効化
BOM認識は他の自動認識より優先度が高いので、データに8bitが混ざっててもUTF-7に誤認識します。

[▼次のスレッド]
INCM/CMT
Cyclamen v3.81