# NAME

AozoraBunko::Checkerkun - 青空文庫の工作員のための文字チェッカー(作:結城浩)をライブラリ化したもの

# SYNOPSIS

    use AozoraBunko::Checkerkun;
    use utf8;

    my $checker1 = AozoraBunko::Checkerkun->new;
    $checker1->check('森※[#「區+鳥」、第3水準1-94-69]外💓'); # => '森※[#「區+鳥」、第3水準1-94-69]→[78hosetsu_tekiyo]【鴎】外💓[gaiji]'
    $checker1->check('жЈ®й·—е¤–'); # => 'жЈ®й·—[gaiji]е¤–'
    $checker1->check('жЈ®йґЋе¤–'); # => 'жЈ®йґЋе¤–'

    my $checker2 = AozoraBunko::Checkerkun->new({ output_format => 'html', gonin1 => 1, gonin2 => 1, gonin3 => 1 });
    $checker2->check('桂さんが柱を壊した。'); # => '<span data-checkerkun-tag="gonin3" data-checkerkun-message="かつら">桂</span>さんが<span data-checkerkun-tag="gonin3" data-checkerkun-message="はしら">柱</span>を壊した。'

    my $checker3 = AozoraBunko::Checkerkun->new({ kouetsukun => 1 });
    $checker3->check('и–®гЃ•г‚“'); # => 'в–ји–®и—Єз±”в–ІгЃ•г‚“'

# DESCRIPTION

AozoraBunko::Checkerkun は、青空文庫工作員のための文字チェッカーで、結城浩氏が作成したスクリプトを私がライブラリ化したものです。

大野裕・結城浩・ゼファー生の各氏による旧字体置換可能チェッカー「校閲君」もこのライブラリに組み込まれています。

# METHODS

## $checker = AozoraBunko::Checkerkun->new(\\%option)

新しい AozoraBunko::Checkerkun インスタンスを生成します。

    my $checker = AozoraBunko::Checkerkun->new(
        'gaiji'            => 1, # JIS外字をチェックする
        'hansp'            => 1, # еЌЉи§’г‚№гѓљгѓјг‚№г‚’гѓЃг‚§гѓѓг‚ЇгЃ™г‚‹
        'hanpar'           => 1, # еЌЉи§’г‚«гѓѓг‚іг‚’гѓЃг‚§гѓѓг‚ЇгЃ™г‚‹
        'zensp'            => 0, # е…Ёи§’г‚№гѓљгѓјг‚№г‚’гѓЃг‚§гѓѓг‚ЇгЃ™г‚‹
        '78hosetsu_tekiyo' => 1, # 78互換包摂の対象となる不要な外字注記をチェックする
        'hosetsu_tekiyo'   => 1, # 包摂の対象となる不要な外字注記をチェックする
        '78'               => 0, # 78дє’жЏ›еЊ…ж‘‚29е­—г‚’гѓЃг‚§гѓѓг‚ЇгЃ™г‚‹
        'jyogai'           => 0, # 新JIS漢字で包摂規準の適用除外となる104字をチェックする
        'gonin1'           => 0, # иЄ¤иЄЌгЃ—г‚„гЃ™гЃ„ж–‡е­—г‚’гѓЃг‚§гѓѓг‚ЇгЃ™г‚‹(1)
        'gonin2'           => 0, # иЄ¤иЄЌгЃ—г‚„гЃ™гЃ„ж–‡е­—г‚’гѓЃг‚§гѓѓг‚ЇгЃ™г‚‹(2)
        'gonin3'           => 0, # иЄ¤иЄЌгЃ—г‚„гЃ™гЃ„ж–‡е­—г‚’гѓЃг‚§гѓѓг‚ЇгЃ™г‚‹(3)
        'simplesp'         => 0, # еЌЉи§’г‚№гѓљгѓјг‚№гЃЇгЂЊ_гЂЌгЃ§гЂЃе…Ёи§’г‚№гѓљгѓјг‚№гЃЇгЂЊв–ЎгЂЌгЃ§е‡єеЉ›гЃ™г‚‹
        'kouetsukun'       => 0, # 旧字体置換可能チェッカー「校閲君」を有効にする(html出力時は kyuji か itaiji のチェッカー君タグ情報が付きます。)
        'output_format'    => 'plaintext', # е‡єеЉ›гѓ•г‚©гѓјгѓћгѓѓгѓ€пј€plaintext гЃѕгЃџгЃЇ htmlпј‰
    );

上記のコードで設定されている値がデフォルト値です。

## $checked\_text = $checker->check($text)

new гЃ§жЊ‡е®љгЃ—гЃџг‚Єгѓ—г‚·гѓ§гѓігЃ§гѓ†г‚­г‚№гѓ€г‚’гѓЃг‚§гѓѓг‚ЇгЃ—гЃѕгЃ™гЂ‚ж€»г‚ЉеЂ¤гЃЇгѓЃг‚§гѓѓг‚ЇеѕЊгЃ®гѓ†г‚­г‚№гѓ€гЃ§гЃ™гЂ‚

# 秘伝のタレ(文字チェック用ハッシュリファレンス)へのアクセス

このモジュールを use すると以下の文字チェック用ハッシュリファレンスへアクセス可能になります。

    # 78互換包摂の対象となる不要な外字注記をチェックする
    $AozoraBunko::Checkerkun::KUTENMEN_78HOSETSU_TEKIYO;

    # 包摂の対象となる不要な外字注記をチェックする
    $AozoraBunko::Checkerkun::KUTENMEN_HOSETSU_TEKIYO;

    # 新JIS漢字で包摂基準の適用除外となる104字
    $AozoraBunko::Checkerkun::JYOGAI;

    # 78дє’жЏ›ж–‡е­—
    $AozoraBunko::Checkerkun::J78;

    # иЄ¤иЄЌ1
    # й–“йЃ•гЃ€г‚„гЃ™гЃ„ж–‡е­—
    # かとうかおりさんの「誤認識されやすい文字リスト」から
    # http://plaza.users.to/katokao/digipr/digipr_charlist.html
    $AozoraBunko::Checkerkun::GONIN1;

    # иЄ¤иЄЌ2
    $AozoraBunko::Checkerkun::GONIN2;

    # иЄ¤иЄЌ3
    # пј€з ‚е ґжё…йљ†гЃ•г‚“гЃ®е…ҐеЉ›гЃ«г‚€г‚‹пј‰
    $AozoraBunko::Checkerkun::GONIN3;

    # ж–°е­—дЅ“гѓ»ж—§е­—дЅ“еЇѕеїњгѓЄг‚№гѓ€
    $AozoraBunko::Checkerkun::KYUJI;

    # з•°дЅ“е­—
    $AozoraBunko::Checkerkun::ITAIJI;

# 秘伝のタレを増量させたい

電子メールや github で要望を受け付けております。

# SEE ALSO

[Net::AozoraBunko](https://metacpan.org/pod/Net::AozoraBunko)

[本ライブラリを用いた新しいチェッカー君](http://chobitool.com/checkerkun/)

[青空文庫作業マニュアル【入力編】](http://www.aozora.gr.jp/aozora-manual/index-input.html)

[гѓЃг‚§гѓѓг‚«гѓјеђ›](http://www.aozora.jp/tools/checker.cgi)

[е¤–е­—](http://www.aozora.gr.jp/annotation/external_character.html)

[еЊ…ж‘‚ (ж–‡е­—г‚ігѓјгѓ‰) - Wikipedia](https://ja.wikipedia.org/wiki/%E5%8C%85%E6%91%82_\(%E6%96%87%E5%AD%97%E3%82%B3%E3%83%BC%E3%83%89\))

[JIS漢字で包摂の扱いが変わる文字(\[78\] \[jyogai\] など)](http://www.aozora.gr.jp/newJIS-Kanji/gokan_henkou_list.html)

[ж Ўй–Іеђ›г‚’дЅїгЃЈгЃ¦гЃїг‚€гЃ†](http://www.aozora.gr.jp/tools/kouetsukun/online_kouetsukun.html)

[Embedding custom non-visible data with the data-\* attributes](http://www.w3.org/TR/html5/dom.html#embedding-custom-non-visible-data-with-the-data-*-attributes)

# LICENSE

Copyright (C) pawa.

This library is free software; you can redistribute it and/or modify
it under the same terms as Perl itself.

# AUTHOR

pawa <pawa@pawafuru.com>