アカウント名:
パスワード:
情報量的にはM77,232,917で表せちゃうものをZIPだと11.2MBも必要とするのか。最悪に近い圧縮率ですね。
#10進数の23,249,425桁の圧縮と考えればがんばってるのは承知の上で
もちろんアスキーコード表記でのテキストファイルだということは分かってますが、素数なのに圧縮できるってことが不思議な感覚です。
バイナリで考えると2の77,232,917乗-1ってことは77,232,917ビット。つまり10MiB未満。アスキーにして圧縮して11MBってのは割と納得できる感じじゃない?
2進表記のテキストを圧縮するとすごく圧縮できますよね。
数学詳しくないから素数の性質わかってないだけかも知れないけど、素数って絶対に圧縮不可なんだっけ?辞書圧縮とかでも?
素数は n までの自然数の中に確率 1/ln n で存在する「ありふれてない数」で低エントロピーだから圧縮率高いだろう。
メルセンヌ数の50番目という記述でいいので辞書圧縮だとヘッダ含めて数バイトで済むレベル。それにメリットがあるのかどうかは分かりません。
まれに圧縮率が高くなるが、ほとんどの場合圧縮できず、圧縮するにも素数判定しなきゃならず時間がかかる、そんな圧縮アルゴリズムになります。そんなのでよければ。
「n番目の素数」と記述すれば、常に圧縮できそうだが。
# ただし速度は考えないものとする。元コメも速度については何も言っていないし計算機科学者でない数学者は通常計算可能かどうか以上のことをあまり気にしないし
「素数の圧縮率」じゃ主語が大きすぎる上に定義も曖昧でほとんど何も言えない。たとえばメルセンヌ素数の2進数表記は明らかに圧縮率が極めて高いわけだが、一般の素数の任意n進数表記で言える話ではない。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日本発のオープンソースソフトウェアは42件 -- ある官僚
圧縮率 (スコア:1)
情報量的には
M77,232,917
で表せちゃうものをZIPだと11.2MBも必要とするのか。
最悪に近い圧縮率ですね。
#10進数の23,249,425桁の圧縮と考えればがんばってるのは承知の上で
Re:圧縮率 (スコア:0)
もちろんアスキーコード表記でのテキストファイルだということは分かってますが、
素数なのに圧縮できるってことが不思議な感覚です。
Re:圧縮率 (スコア:2, 興味深い)
バイナリで考えると2の77,232,917乗-1ってことは77,232,917ビット。
つまり10MiB未満。
アスキーにして圧縮して11MBってのは割と納得できる感じじゃない?
Re: (スコア:0)
2進表記のテキストを圧縮するとすごく圧縮できますよね。
Re: (スコア:0)
数学詳しくないから素数の性質わかってないだけかも知れないけど、素数って絶対に圧縮不可なんだっけ?
辞書圧縮とかでも?
Re: (スコア:0)
素数は n までの自然数の中に確率 1/ln n で存在する「ありふれてない数」で低エントロピーだから圧縮率高いだろう。
Re: (スコア:0)
メルセンヌ数の50番目という記述でいいので辞書圧縮だとヘッダ含めて数バイトで済むレベル。それにメリットがあるのかどうかは分かりません。
Re: (スコア:0)
まれに圧縮率が高くなるが、ほとんどの場合圧縮できず、圧縮するにも素数判定しなきゃならず時間がかかる、そんな圧縮アルゴリズムになります。そんなのでよければ。
Re: (スコア:0)
「n番目の素数」と記述すれば、常に圧縮できそうだが。
# ただし速度は考えないものとする。元コメも速度については何も言っていないし計算機科学者でない数学者は通常計算可能かどうか以上のことをあまり気にしないし
Re: (スコア:0)
「素数の圧縮率」じゃ主語が大きすぎる上に定義も曖昧でほとんど何も言えない。
たとえばメルセンヌ素数の2進数表記は明らかに圧縮率が極めて高いわけだが、一般の素数の任意n進数表記で言える話ではない。