07
24
25
26
27
28
29
30
31
   

日本語が文字化けしたら「日本語文字コード」を疑え

キャプチャ

3月決算企業の本決算短信も続々と発表されています。そこで財務分析しようとエクセルにコピーしたら、何だか怪しい呪文みたいになってしまいました。


--大変だみょ 壊れたみょ

いえ。壊れたわけではありません。条件によっては正常な現象なのです。元のデータもエクセルデータも正常なのです。

ややこしい説明は後回しにして、とにかくエクセルに張り付けるには、一度windows標準の「メモ帳」を起動します。メモ帳にそのまま張り付けてみます。

キャプチャ

--うにゃ? なおったみょ

うん。もともと壊れていませんから。メモ帳の内容をすべてコピーして、Excelに貼り付けます。

キャプチャ

貼り付けられました。


もう一度怪しい呪文のようなものを確認します。数字の部分はそのまま残っています。呪文っぽくなったのは日本語部分だけです。そう「文字化け」と呼ばれる現象です。

でも、別に化けているわけではないのです。ちゃんと表示されています。日本人に読めないだけなのです。

そもそもコンピュータの世界はアルファベットと数字と一部の記号の世界です。そこに、無理やり日本語を表示させているのです。だってビルゲイツは日本語を知らないわけですから。

最初はコンピュータメーカーで勝手に日本語表示を作っていましたが、それでは不便ですので、徐々に統一されてきました。それでも完全には統一されていません。パソコンは古くから「SHIFT_JIS」が使われてきて、UNIXは古くから「EUC」が使われてきました。

インターネットはUNIXのからくりを利用しています。そう。インターネットは古くから「EUC」の世界だったのです。でも、パソコンでインターネットの日本語が扱えないと困ります。そこで、Webブラウザやメールソフトなどのインターネットに関連するツールは「どちらも使える」ようになっています。

キャプチャ
出所:google chrome エンコード


--んじゃ エクセルもどちらも使えるようにすればいいんだみょ

いや。それは、文字コードを完全に統一できないのと同じ理由で難しいのです。仮に新しいExcelだけがいろいろな文字コードが使えるようになったとすると、文字コードを変えたファイルは他のファイルとコピペできません。

何とか他ファイルとの問題をクリアできたとしても、他のアプリとのコピペはどうなるでしょう。ビルゲイツのジレンマもわかります。

ユーザーが一度メモ帳を経由すればいいのです。


インターネットにはいろいろなデバイスで、いろいろな環境からアクセスできます。文字コードが乱立しているのに、普段はそれを意識しないで利用できているということは奇跡的なことです。

時々不具合が出るのはむしろ当たり前のことなのです。文字コードの問題は、「機種依存文字」や「HTMLの特殊文字」などと同種です。例えば「ひよこ投資家™」で使っている「™」はHTMLの特殊文字です。

「文字化け」は、みんなが自分の環境で使えるためのしくみの副作用として存在しているのです。足りない分は利用者の工夫で便利に使っていくのが平和なのだと思います。
Secret

プロフィール

もきち♪

Author:もきち♪
個人事業主ですが株式投資のほうが主体になっています。

投資スタイルは逆張りナンピン。チキンになりきれないひよこ投資家™でピヨピヨトレードです。

2007年に投資信託を始めて、2009年に国内株式の個別銘柄投資を始めました。

中小企業診断士(診断業務休止中)でオンライン情報処理技術者です。

ブログでは株式投資とコンピュータの話がメインになるかな?

きほんゆるめに。。。

【FISCOソーシャルレポーター】ってのに公認されました。


キャプチャ
もきち♪への直通メール

スピンオフサイト

ブログ内リンク

全ての記事を表示する
データをダウンロードできるサイト一覧

ブログ内検索

過去の記事

全ての記事一覧

カテゴリ

最新記事

ランキング




経済ニュース













使っている証券会社

スポンサーリンク

おすすめ



カンファレンスバナー

アフィリエイトフレンズ

クラウドソーシング「ランサーズ」

広告