このサイトでは、デフォルト文字コードをUTF-8としています。
実は昨日まではEUC-JPでした。というのもデータベースの文字コードがEUC-JPだからでした。
しかしこれがまあ不具合の嵐だったのですよ。いや単にオレの技術力不足なんだけど。
Amazon Web ServicesではクエリをUTF-8で送信しなければならんのです。これが鬼門。EUC-JPでPOSTされた文字列をUTF-8にエンコードする場合、文字列が短い場合に文字化けを起こすのです。これはマルチバイト文字コードの定め。たとえばEUC-JPの「名前」はUTF-8にうまくコンバートできない。十分に長ければ問題はないんだけどそんな不確実な条件に頼るわけにはいかない、ということで汎用的なUTF-8になおしました。
内部で文字コードの変換をしまくってたんで結構大規模な修正になってしまった。
一応実験環境で直しつつアップしたんですが、DBにデータを入れる処理の一部にバグがあったようで、しばらくバグありの状態で公開となっていたわけです。AmazonDS検索は正常にできてたんですけどね。
まだまだ問題あるなあ。地道に改良してゆきます。出来ればもっと高速化したいしね。
このサイトの文字コードについて
トラックバック(0)
このブログ記事を参照しているブログ一覧: このサイトの文字コードについて
このブログ記事に対するトラックバックURL: http://www.studio-wiz.com/mt/mt-tb.cgi/12

コメントする