<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>OTCHY.NET &#187; utf-8</title>
	<atom:link href="http://www.otchy.net/tag/utf-8/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.otchy.net</link>
	<description>Otchy の技術ネタ。JavaScript 率と Twitter 率がやや高く、他にも PHP/Java/Perl などなど。共通点は Web。</description>
	<lastBuildDate>Wed, 01 Feb 2012 14:39:17 +0000</lastBuildDate>
	<generator>http://wordpress.org/?v=2.9.2</generator>
	<language>ja</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
			<item>
		<title>JavaScript だけでクロスドメインで POST メソッドを送る方法</title>
		<link>http://www.otchy.net/20090923/send-post-method-to-cross-domain-only-use-javascript/</link>
		<comments>http://www.otchy.net/20090923/send-post-method-to-cross-domain-only-use-javascript/#comments</comments>
		<pubDate>Tue, 22 Sep 2009 17:05:05 +0000</pubDate>
		<dc:creator>Otchy</dc:creator>
				<category><![CDATA[Development]]></category>
		<category><![CDATA[javascript]]></category>
		<category><![CDATA[twitter]]></category>
		<category><![CDATA[utf-8]]></category>

		<guid isPermaLink="false">http://www.otchy.net/?p=804</guid>
		<description><![CDATA[JavaScript のみを使って、クロスドメインを実現しつつ POST メソッドでリクエストを送信する方法について解説します。
ここで解説する方法にはこんな特徴があります。
(2009-10-30 追記) iframe [...]]]></description>
			<content:encoded><![CDATA[<p>JavaScript のみを使って、クロスドメインを実現しつつ POST メソッドでリクエストを送信する方法について解説します。<br />
ここで解説する方法にはこんな特徴があります。<br />
<strong>(2009-10-30 追記)</strong> iframe の unload のタイミングについて、重大な不具合がある可能性に気づきました。<del>Chrome/</del>Firefox において、2度イベントが発生している可能性が高いです。unload イベントを使わない場合は無関係です。結論が分かったら修正版をこのページで公開します。<br />
<strong>(2010-01-29 追記)</strong> Chrome は大丈夫そうです。Firefox もカウンタ or フラグを使ってイベントを記録すれば大丈夫ぽいです。ちゃんと直せて無くてすいません。</p>
<ul>
<li>XMLHttpRequest では不可能な、クロスドメインによるポストを実現している。</li>
<li>元になるページの文字エンコードの種類にかかわらず、必ず UTF-8 でポストできる。</li>
<li>ポストが終わったタイミングをイベントで捕捉できる。</li>
<li>JavaScript だけで実現するので、サーバサイドに何らかのスクリプトを用意する必要がない。</li>
<li>必要な HTML は DOM で後から埋め込むので、元になっているページの HTML は修正する必要がない。</li>
</ul>
<p>さて、話の発端は、<a href="/greasemonkey/hatebu-with-twitter/">はてブ with Twitter</a> になります。<br />
このスクリプトは、元々 Greasemonkey に搭載されている GM_xmlhttpRequest 関数を使って実装されていました。<br />
GM_xmlhttpRequest は通常の XMLHttpRequest に存在するクロスドメインの制限がないので (その分危ないとも言えますが)、 「はてブを追加する前に Twitter につぶやいて、その処理が終わってからはてブを追加する」という事がいとも簡単に実現していました。<br />
ところがこのスクリプトを Google Chrome に対応させるにあたって、Google Chrome では、GM_* 系の関数が存在しないので、それを代替する手段を模索する必要があったのです。</p>
<p>通常、JavaScript によるクロスドメインというと、API 側が、JSONP 対応している前提で、script タグを埋め込んで対応するのが一般的です。<br />
ただ、この方法には制限があり、script タグによるリクエストは必ず GET メソッドになってしまいます。<br />
Twitter の API は大半が GET でアクセスできるのですが、つぶやきを送信する API については、POST でのアクセスが必須となっていて、Twitter でつぶやくために JSONP を使う事は出来ません。</p>
<p>単につぶやいてそれっきり、という動きでよければ、以前 <a href="/20090416/bookmarklet-for-twitter/">閲覧中のページについてそこから遷移せずTwitterでつぶやくためのブックマークレット</a>でやったのと同じ方法でいいのですが、はてブへの追加をするにあたっては、Twitter API へのアクセス完了を待たないといけないので、そのあたりを解決したのが、Google Chrome 版スクリプトになります。</p>
<p>以下では、はてブ with Twitter (for Google Chrome) のソースから一部を抜粋して、どうやってその動作を実現したかを解説してきます。</p>
<pre>
var d = document;
var f = /* なんかのフォーム Element */;
var b = /* なんかのサブミットボタン Element */;

// サブミットボタンにイベント登録
b.addEventListener('click', function (e) {
    // クロスドメインポスト用隠し iframe
    var i = d.createElement('iframe');
    i.style.display = 'none';
    d.body.appendChild(i);

    // レスポンスイベント取得用隠し iframe
    var i2 = d.createElement('iframe');
    i2.name = 'postresult';
    i2.style.display = 'none';
    d.body.appendChild(i2);

    // レスポンス時イベント登録
    i2.contentWindow.addEventListener('unload', function(e) {
        f.submit();
    }, false);

    // クロスドメインへの POST メソッド送信
    var iDoc = i.contentWindow.document;
    iDoc.open();
    iDoc.write('&lt;form method=&quot;POST&quot; action=&quot;http://twitter.com/statuses/update.xml&quot; target=&quot;postresult&quot;&gt;');
    iDoc.write('&lt;input type=&quot;hidden&quot; name=&quot;status&quot; value=&quot;ポストしたい内容&quot; /&gt;');
    iDoc.write('&lt;/form&gt;');
    iDoc.write('&lt;script&gt;window.onload = function(){document.forms[0].submit();}&lt;/script&gt;');
    iDoc.close();

    // サブミットボタン本来の動作をキャンセル
    e.preventDefault();
}, false);
</pre>
<p>このソースは、元々ページに存在するフォームに対して、そのサブミットボタンの動作をフックし、サブミットが行われる前に Twitter へのつぶやき (クロスドメインでの POST メソッド送信) をして、それが完了したから本来のサブミットをする、という動作を意図しています。<br />
ソース中の f が元々のフォーム、b が元々のサブミットボタンです。</p>
<p>まず、サブミットボタンの click イベントを追加し、イベントの中で、e.preventDefault() する事で、本来のサブミット動作をキャンセルします。<br />
そしてそのイベントの中で、i と i2 という 2 つの不可視 iframe を追加しています。</p>
<p>i は、POST メソッド送信用の iframe です。<br />
<i>window</i>.write メソッドを使って iframe 内に form を組み立てつつ、<i>window</i>.onload で、読み込みと同時に <i>form</i>.submit() が走るようにしておきます。<br />
ここで、form タグの method に POST を指定し、target に i2 の name を指定するのがポイントです。</p>
<p>i2 はあらかじめ name を指定してある iframe です。<br />
i2 については、中身は空のままでいいですが、unload イベントを登録しておくのがポイントです。<br />
これにより、i の中の POST 処理結果が i2 に送られたタイミングで i2 の unload イベントが発生するので、POST の完了を捕捉する事が出来ます。<br />
ここで f.submit() と本来のサブミット動作を指定する事により、サブミットボタンのクリック動作をフックして別の動作を組み込む事が実現します。</p>
<h4>(備考) 後かたづけの必要性</h4>
<p>この例では、i2 の unload イベントの中で、親画面を遷移させてしまっているのでそれっきりでいいですが、親画面をそのままにする場合は、i と i2 を削除するなど後かたづけをしておく必要があるでしょう。<br />
JSONP を使う場合もそうですが、テンポラリに生成したエレメントを放置していると、動的な HTML がどんどん汚くなって非常にマナーが悪いので後かたづけもちゃんと考えたいですね。</p>
<h4>(備考) なぜ iframe で POST するのか</h4>
<p>実は、単に POST メソッドを送信するだけでよければ、1つ目の iframe は不要です。document に直接 form を追加する事でも POST メソッドを送信する事が出来ます。<br />
あえて、iframe を追加し、<i>window</i>.write で form を作っているのは、文字コードの都合になります。<br />
iframe を空っぽの状態から作ると、内部的にその iframe の文字コードが UTF-8 になる事を利用して、POST の内容を UTF-8 にしています。<br />
Web 用に POST メソッドの API を公開しているような最近のサービスは、要求される文字コードが大抵 UTF-8 かと思うので、元のページが Shift_JIS とか、EUC-JP であっても、iframe を利用すればスムーズに API を使えます。</p>
<h4>(備考) なぜ iframe が 2 つ必要なのか</h4>
<p>iframe を 1 つにして、それ自身の unload イベントを捕捉すればいいじゃないか、と思ったアナタ。その通りです。正しい思考です。<br />
こればっかりは、実際にやって上手くいかなかったから、としか言えません。どうも、POST 後に unload イベントが発生していなかったようなので、2 つめの iframe を用意してやる必要がありました。</p>
<p>Twitter API が返すのが xml だからなのか、クロスドメインの制約によるものか、Firefox だったらそれでも上手くいくのか、理由はよく分かりません。<br />
まあ、このあたりも含めて一種のノウハウなのでそのまま公開します。</p>
<h4>(備考) IE の場合</h4>
<p>IE の場合は未検証ですが、イベント周りの扱いが標準とかけ離れているので、上記のソースがそのまま動く事はないです。<br />
具体的には、addEventListener のあたりと、preventDefault のあたりは確実に違います。<br />
もし IE も視野に入れてどうにかしたいなら、イベントモデルの差異を吸収してくれているラッパ (jQuery やら prototype.js やら) を使うのが賢明かと思います。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.otchy.net/20090923/send-post-method-to-cross-domain-only-use-javascript/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>JavaScript だけで Shift_JIS/EUC-JP のページから UTF-8 に変換して POST する方法</title>
		<link>http://www.otchy.net/20090416/post-utf8-charset-by-only-javascript/</link>
		<comments>http://www.otchy.net/20090416/post-utf8-charset-by-only-javascript/#comments</comments>
		<pubDate>Thu, 16 Apr 2009 02:15:54 +0000</pubDate>
		<dc:creator>Otchy</dc:creator>
				<category><![CDATA[Development]]></category>
		<category><![CDATA[javascript]]></category>
		<category><![CDATA[utf-8]]></category>

		<guid isPermaLink="false">http://www.otchy.net/?p=504</guid>
		<description><![CDATA[1 個前のエントリで、JavaScript だけを用いて、任意の文字コードのページから、UTF-8 エンコーディングで任意のサーバに (クロスドメインして) POST する方法を編み出しました。
その部分だけで需要がある [...]]]></description>
			<content:encoded><![CDATA[<p><a href="http://www.otchy.net/20090416/bookmarklet-for-twitter/">1 個前のエントリ</a>で、JavaScript だけを用いて、任意の文字コードのページから、UTF-8 エンコーディングで任意のサーバに (クロスドメインして) POST する方法を編み出しました。<br />
その部分だけで需要があるのではないかと思ったので、関数として取り出して公開します。</p>
<p>案外スマートに書けたのでご機嫌です。</p>
<pre>function postUtf8(param)
    if (!param) return;
    param = param.replace(new RegExp('&amp;', 'g'), '&amp;amp;');
    param = param.replace(new RegExp('"', 'g'), '&amp;quot;');
    param = param.replace(new RegExp('&lt;', 'g'), '&amp;lt;');
    param = param.replace(new RegExp('&gt;', 'g'), '&amp;gt;');
    var d = document;
    var i = d.createElement('iframe');
    i.style.display = 'none';
    d.body.appendChild(i);
    var iDoc = i.contentWindow.document;
    iDoc.open();
    iDoc.write('&lt;form method="POST" action="http://server/path/file"&gt;');
    iDoc.write('&lt;input type="hidden" name="param" value="' + param + '" /&gt;');
    iDoc.write('&lt;/form&gt;');
    iDoc.write('&lt;script&gt;window.onload = function(){document.forms[0].submit();}&lt;/script&gt;');
    iDoc.close();
    setTimeout(function() {
        d.body.removeChild(i);
    }, 5000);
}</pre>
<p>こんな感じです。<br />
http://server&#8230; と、param の部分を書き換えれば、好きなサーバに好きなパラメータを渡せますね。<br />
POST 先のサーバが重い時は、setTimeout の 5000 の値をもう少し大きめに取った方がいいかもしれません。</p>
<p>簡単に技術的な説明もしておきましょうか。<br />
基本的には、iframe を新規で作成すると、その文字コードがデフォルトで UTF-8 として処理される事を利用しています。</p>
<p>iframe の中身は当初 DOM で構築しようとしたのですが、うまくいかず、document.write で構築しています。</p>
<p>iframe 内で window.onload しているのは、これまた直接 script タグ内で submit しようとすると、その時点では iframe の DOM 構築が完了しておらず、submit 出来ないためです。<br />
iDoc.close(); しないと、DOM が構築されないのではないかと予想されます。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.otchy.net/20090416/post-utf8-charset-by-only-javascript/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>PHP で日本語のひらがなとカタカナと漢字を判別する方法 [UTF-8編]</title>
		<link>http://www.otchy.net/20090128/php-chartype-judgment-in-utf8/</link>
		<comments>http://www.otchy.net/20090128/php-chartype-judgment-in-utf8/#comments</comments>
		<pubDate>Tue, 27 Jan 2009 16:26:01 +0000</pubDate>
		<dc:creator>Otchy</dc:creator>
				<category><![CDATA[Development]]></category>
		<category><![CDATA[php]]></category>
		<category><![CDATA[utf-8]]></category>

		<guid isPermaLink="false">http://www.otchy.net/?p=244</guid>
		<description><![CDATA[ちょっと思うところあって調べたのでメモしておきます。
結局使わない事になったんですが。
mb_regex_encoding('UTF-8');
if (preg_match("/^[ぁ-んー]+$/u", $str))  [...]]]></description>
			<content:encoded><![CDATA[<p>ちょっと思うところあって調べたのでメモしておきます。<br />
結局使わない事になったんですが。</p>
<pre>mb_regex_encoding('UTF-8');
if (preg_match("/^[ぁ-んー]+$/u", $str)) {
    // ひらがな
} else if (preg_match("/^[ァ-ヶー]+$/u", $str)) {
    // カタカナ
} else if (preg_match("/^[一-龠]+$/u", $str)) {
    // 漢字
}</pre>
<p>mb_regex_encoding(&#8216;UTF-8&#8242;); は正規表現の基準となる文字コードの指定です。<br />
php.ini がいじれる環境なら、[mbstring] セクションに、mbstring.internal_encoding = UTF-8 とした方が良いかと思います。</p>
<p>[あ-ん] 等の指定は、Unicode 上でひらがなやカタカナを表す文字コードの最初と最後の文字を、範囲指定しています。<br />
また、厳密に言うと漢字の最後は &#8220;龠&#8221; では無いのですが、一般的に漢字と見なされる範囲の中で、最後にある JIS 第二水準の漢字であるため、この字を採用しています。(この漢字の範囲には、中国の漢字やハングルなどが含まれます)<br />
全然異なる文脈ですが、<a href="http://www.tanimoto.to/comp/bm.html" target="_blank">このページ</a>で詳しく考察されています。</p>
<p>preg_match の u フラグは、UTF-8 を正しく扱えるようにするためのフラグです。これがないと、文字コードの範囲指定などが正しく動作しないようです。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.otchy.net/20090128/php-chartype-judgment-in-utf8/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

