2006-10-21から1日間の記事一覧

文字列のcase展開 (3)

しかし、その対処方法で本当に大丈夫かというと、ちょっと自信がもてない。例えば、文字列が繰り返しの中にある場合が危険な気がする。でも、恣意的に同じ文字列の繰り返しを対象データとして渡さなければ、問題は起こらない気もする。とりあえずそれで様子…

文字列のcase展開 (2)

で、何故このように実装を変更したのか? 今回、Unicodeのcase foldを全部サポートしたので、case変換に今まで以上のコストが掛かるようになった。それで、matching時点でのcase変換はできるだけやらずに済ませたいというのが理由だ。 どうやって問題を解決…

文字列のcase展開

Caseless matchに対して、以前の実装では実際のmatching処理のときに文字列をcase変換して比較していた。今回の実装では、正規表現のコンパイル時点で、文字列を可能なcaseの選択肢の組合せで展開するように変更した。それで特殊な場合を除いては、matching…

追加

[:word:]が今はない。次のリリースで追加する。

バグ

もうバグ報告を受けてしまった。 \p{Word}が働かない (Unicode以外の文字コードのとき) \p{Alnum},\p{ASCII}, [:alnum:], [:ascii:] が正しくない 来週早々にリリースします。