このサイトの文字コードについて

| | コメント(0) | トラックバック(0) この記事をはてなブックマークに追加

 このサイトでは、デフォルト文字コードをUTF-8としています。
実は昨日まではEUC-JPでした。というのもデータベースの文字コードがEUC-JPだからでした。
しかしこれがまあ不具合の嵐だったのですよ。いや単にオレの技術力不足なんだけど。
Amazon Web ServicesではクエリをUTF-8で送信しなければならんのです。これが鬼門。EUC-JPでPOSTされた文字列をUTF-8にエンコードする場合、文字列が短い場合に文字化けを起こすのです。これはマルチバイト文字コードの定め。たとえばEUC-JPの「名前」はUTF-8にうまくコンバートできない。十分に長ければ問題はないんだけどそんな不確実な条件に頼るわけにはいかない、ということで汎用的なUTF-8になおしました。
内部で文字コードの変換をしまくってたんで結構大規模な修正になってしまった。
 一応実験環境で直しつつアップしたんですが、DBにデータを入れる処理の一部にバグがあったようで、しばらくバグありの状態で公開となっていたわけです。AmazonDS検索は正常にできてたんですけどね。
まだまだ問題あるなあ。地道に改良してゆきます。出来ればもっと高速化したいしね。

トラックバック(0)

このブログ記事を参照しているブログ一覧: このサイトの文字コードについて

このブログ記事に対するトラックバックURL: http://www.studio-wiz.com/mt/mt-tb.cgi/12

コメントする

このブログ記事について

このページは、マピロが2008年7月25日 19:33に書いたブログ記事です。

ひとつ前のブログ記事は「シマシマと孤独のグルメ」です。

次のブログ記事は「今月のアフタヌーンのみどころはヴィンランド・サガ」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

ウェブページ

Powered by Movable Type 4.14