アカウント名:
パスワード:
大変だなあ。新元素命名のたびに新しい文字を作ってたら、無限に増やさなきゃならないのに。#無限には増えません。
そういえば北朝鮮では偉大なる首領さまの名を表現する文字はユニークじゃなきゃならないんで金日成・金正成・金成男の「金」とか「成」とかは別々のコードになってるんでしたっけ。こっちこそ無限に増殖しそうだ。
もっとも、日本だって文字コードじゃなくて休日の話だが、歴代天皇誕生日のうち明治節と天長節は平成の御世でもお休みなんで、今後無限に天皇誕生日が増える可能性はあるのだが。
>金正成・金成男
落ち着けw○金正日・金正恩
日本みたいに「誤記」から始まる新字ではなく、こういうことで新字が定義されちゃうのね?意外というか、感覚的に馴染めないというか・・・個人的には「字」を増やすのなんかやめてほしいと思ってしまいますけどね。「既存文字を組み合わせた造語でいいじゃん!」って思います。日本語ではないようなので影響はありませんが。
大きな勘違いだったのかも。Unicodeに登録されていなかっただけで、実は既存文字だったのか・・・・な?
# Unicodeも部首ごとに文字コード割り当てて合成すればあんなにコードポイント必要なかったりして
それが上のストーリーに書いてあるIDS (Ideographic Description Sequence)ですよコードポイントの量は必要ないけど、合成方式だと一文字のバイト数が膨れ上がるからなぁ。簡単な文字でも3コードポイント→UTF-8で9バイトとか。
> 国王の諱を避けるために既存の文書や名前を全部書き換えるくらいなら
中国ではそれをやってたような。
ちなみに諱を避けるために最後の画をわざと省いたりした文字(欠画)もUnicodeに入ってる。アメリカは諱セレクターを提案したが、中国の強い要望で独立した文字として符号化された(中国は合成で漢字を表すのを嫌う傾向があるようだ)。
日本で文字コードで今後増えていきそうなのと言えば㍾㍽㍼㍻じゃないですか?
文字コード領域が予約済らしいですよ。いくつあったか忘れたけどあまり多くなかったような…。
しばらくするとマヤ文明みたいに「文字コードは日本の終末を予期していた…!?」ってなりそうだね
いやいや、これは元号が予期されていると見るべきでしょう。次の元号は… ㍺
なんかあぶり出しみたいでドキドキします。
来年の今頃には、お目にかかれるんでしょうか。
で、終末論が盛んになったところで何も起こらず元に戻る
1991年のUnicode1.0で35、1993年の1.1で4に減って、2003年の4.0からは0みたいです。
政府「来年から歴代天皇の御誕生記念として1年のうち125日間を祝日にしました。みなさんいっぱい休んでね!」
漢字コードは隣接すべき文字や使用頻度で桁を増やす浮動小数点数にしとけばよかったのにねUTFエンコードは特定バイトを避けながらの小数点表現に成りちょっと大変かもだけど
浮動小数点数の誤差で文字化けしそう
新しい存在に新しい名前を付けるのは自然なことだし、新しい文字を作るのも漢字の性質的には当然って気もしますけどね。それをコンピューターの都合で制約することの方が不自然だと思います。本来はね
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲはアレゲを呼ぶ -- ある傍観者
無限増殖 (スコア:0)
大変だなあ。新元素命名のたびに新しい文字を作ってたら、無限に増やさなきゃならないのに。
#無限には増えません。
そういえば北朝鮮では偉大なる首領さまの名を表現する文字はユニークじゃなきゃならないんで
金日成・金正成・金成男の「金」とか「成」とかは別々のコードになってるんでしたっけ。
こっちこそ無限に増殖しそうだ。
もっとも、日本だって文字コードじゃなくて休日の話だが、歴代天皇誕生日のうち明治節と天長節は
平成の御世でもお休みなんで、今後無限に天皇誕生日が増える可能性はあるのだが。
Re:無限増殖 (スコア:2, すばらしい洞察)
>金正成・金成男
落ち着けw
○金正日・金正恩
Re:無限増殖 (スコア:1)
日本みたいに「誤記」から始まる新字ではなく、こういうことで新字が定義されちゃうのね?
意外というか、感覚的に馴染めないというか・・・個人的には「字」を増やすのなんかやめてほしいと思ってしまいますけどね。
「既存文字を組み合わせた造語でいいじゃん!」って思います。
日本語ではないようなので影響はありませんが。
Re:無限増殖 (スコア:1)
大きな勘違いだったのかも。
Unicodeに登録されていなかっただけで、実は既存文字だったのか・・・・な?
Re: (スコア:0)
ニホニウムとか「金+爾の異体字」でしょう
# Unicodeも部首ごとに文字コード割り当てて合成すればあんなにコードポイント必要なかったりして
Re:無限増殖 (スコア:1)
# Unicodeも部首ごとに文字コード割り当てて合成すればあんなにコードポイント必要なかったりして
それが上のストーリーに書いてあるIDS (Ideographic Description Sequence)ですよ
コードポイントの量は必要ないけど、合成方式だと一文字のバイト数が膨れ上がるからなぁ。
簡単な文字でも3コードポイント→UTF-8で9バイトとか。
Re: (スコア:0)
国王の諱を避けるために既存の文書や名前を全部書き換えるくらいなら、国王に専用の漢字割り当てた方が労力少なくてすむだろうし
Re:無限増殖 (スコア:1)
> 国王の諱を避けるために既存の文書や名前を全部書き換えるくらいなら
中国ではそれをやってたような。
Re: (スコア:0)
ちなみに諱を避けるために最後の画をわざと省いたりした文字(欠画)もUnicodeに入ってる。アメリカは諱セレクターを提案したが、中国の強い要望で独立した文字として符号化された(中国は合成で漢字を表すのを嫌う傾向があるようだ)。
Re: (スコア:0)
日本で文字コードで今後増えていきそうなのと言えば
㍾㍽㍼㍻
じゃないですか?
Re: (スコア:0)
文字コード領域が予約済らしいですよ。
いくつあったか忘れたけどあまり多くなかったような…。
Re:無限増殖 (スコア:1)
しばらくするとマヤ文明みたいに「文字コードは日本の終末を予期していた…!?」ってなりそうだね
Re: (スコア:0)
いやいや、これは元号が予期されていると見るべきでしょう。
次の元号は… ㍺
Re: (スコア:0)
なんかあぶり出しみたいでドキドキします。
来年の今頃には、お目にかかれるんでしょうか。
Re: (スコア:0)
で、終末論が盛んになったところで何も起こらず元に戻る
Re: (スコア:0)
1991年のUnicode1.0で35、1993年の1.1で4に減って、2003年の4.0からは0みたいです。
Re: (スコア:0)
政府「来年から歴代天皇の御誕生記念として1年のうち125日間を祝日にしました。みなさんいっぱい休んでね!」
Re: (スコア:0)
漢字コードは隣接すべき文字や使用頻度で桁を増やす浮動小数点数にしとけばよかったのにね
UTFエンコードは特定バイトを避けながらの小数点表現に成りちょっと大変かもだけど
Re: (スコア:0)
浮動小数点数の誤差で文字化けしそう
Re: (スコア:0)
新しい存在に新しい名前を付けるのは自然なことだし、新しい文字を作るのも漢字の性質的には当然って気もしますけどね。
それをコンピューターの都合で制約することの方が不自然だと思います。本来はね