可読性スコアラー
テキストを貼り付けて、5つの確立された公式に従って読書レベルを瞬時に視覚化します。
結果は入力するにつれて更新されます。正確な結果のために最低約100単語が推奨されます。
📚 科学的根拠と情報源
このツールが対象とする人
読みやすさの評価は、コンテンツクリエイター、教師、健康コミュニケーター、多様な視聴者向けに執筆する人にとって有益です。National Center for Education Statistics(NCES)によると、PIAACで測定された米国の成人の大部分が基本的なリテラシーレベル以下で読書しています。CDCとNIHは、健康文書が広い理解を確保するために6年生(米国の小学6年生レベル、フランスのCM1/CM2に相当)レベルで書かれることを推奨しています。認知障害、学習障害、非ネイティブ話者、高齢者は、複雑なテキストの影響を不釣り合いに受けます。
公式参考文献
- Flesch, R.(1948年)。「A new readability yardstick。」 Journal of Applied Psychology, 32(3), 221–233。 · 元のFlesch Reading Ease公式; 高いスコアが読みやすさを示す0〜100のスケール。
- Kincaid, J.P., Fishburne, R.P., Rogers, R.L. & Chissom, B.S.(1975年)。「Derivation of new readability formulas for Navy enlisted personnel。」 Research Branch Report 8-75, Naval Technical Training Command。 · Fleschの公式を再較正して、米国の学年レベルを生成します。
- Gunning, R.(1952年)。 The Technique of Clear Writing. McGraw-Hill。 · Fog Indexは、テキストを最初の読書で理解するために必要な学年数を推定します。
- Coleman, M. & Liau, T.L.(1975年)。「A computer readability formula designed for machine scoring。」 Journal of Applied Psychology, 60(2), 283–284。 · より信頼性の高い自動スコアリングのために、音節ではなく文字数を使用します。
- McLaughlin, G.H.(1969年)。「SMOG grading, a new readability formula。」 Journal of Reading, 12(8), 639–646。 · 米国保健福祉省によって、健康リテラシー評価のゴールドスタンダードと広く考えられています。
- Smith, E.A. & Senter, R.J.(1967年)。「Automated Readability Index。」 AMRL-TR-66-220。Wright-Patterson Air Force Base。 · 元々は軍事技術マニュアルの自動スコアリング用に設計された文字ベースの公式。
免責事項
読みやすさの公式は、表面的なテキスト特徴(単語の長さ、文の長さ、音節数)に基づく統計的推定を提供します。理解、首尾一貫性、コンテンツの正確性を測定しません。どの公式も、読者の事前知識、動機、または認知/学習障害の存在を完全に考慮することはできません。これらのスコアは、テキストアクセシビリティを評価する際の他の指標の1つとして使用してください。このツールは、医療、教育、法的アドバイスを提供しません。
可読性の式の 75 年の歴史
可読性スコアリングは 1943 年に Rudolf Flesch のコロンビア大学での博士研究から始まり、1948 年に Flesch Reading Ease として定式化されました:0-100 のスコアで、高いほど読みやすいことを示します。米海軍は 1975 年に再校正を委託しました(Kincaid 他、海軍技術訓練司令部レポート 8-75)、これは同じ表面的特徴(単語あたりの音節、文あたりの単語)を米国の学校学年レベルにマッピングしました。これが 1990 年代初頭から Microsoft Word に組み込まれている Flesch-Kincaid Grade Level です。他の式が空白を埋めました:ビジネスライティングのための Robert Gunning の Fog Index(1952);米国保健福祉省により健康リテラシーのゴールドスタンダードとして採用された McLaughlin の SMOG(1969);Coleman-Liau(1975)および ARI(Smith & Senter、1967)は音節の代わりに文字数を使い、プログラム的に音節を数える必要性を回避します。Dale-Chall 式(Edgar Dale、1948 年、1995 年改訂)は「親しみのある」単語の語彙リストを使用します。新しい Lexile Framework(MetaMetrics、1989)と ATOS(Renaissance Learning、1999)はコーパスベースで、米国の学校で使用されています。これらすべての式はプロキシを測定し、理解度ではありません。結果を「可読性」として扱い、「理解度」とは扱わないでください。
異なる対象者のための目標学年レベル
- 健康および医療コミュニケーション。CDC と NIH は 6 年生レベル以下で書くことを推奨しています(Flesch Reading Ease ≥ 70、SMOG ≤ 8)。CDC の Clear Communication Index と AMA の「Health Literacy」ガイドラインがこれを成文化しています。病院の退院指示、ワクチン情報シート、患者同意書は定期的にこの目標を 4-6 学年で逃しています。
- ニュースとジャーナリズム。Reuters、AP、BBC のハウススタイルは 9 年生レベルを目標にしています(Flesch Reading Ease 60-70)。New York Times は平均で約 9-10、The Economist は 13-14、USA Today は 6-7 です。タブロイド紙や Reddit の投稿はしばしば 8 年生以下のスコアです。
- 法律および政府文書。米国の 2010 年の Plain Writing Act は、連邦機関に公開文書を平易な言語で書くことを要求しています;PlainLanguage.gov は最大 8 年生を提案しています。英国の Plain English Campaign(1979 年設立)は消費者契約の 9 年生を目標としています。ほとんどの保険証券と EULA は 14-18 年生で、ほぼすべての消費者の閾値をはるかに超えています。
- マーケティングおよび SEO コンテンツ。Yoast SEO と Surfer は、一般的な Web コンテンツの Flesch Reading Ease を 60 以上(約 8 年生)推奨しています。Buffer はブログを分析し、6-9 年生の投稿が 13+ 年生の投稿より 36% 高いエンゲージメントを持つことを発見しました。Mailchimp はメールの件名に 7 年生を推奨しています。
- 教育と教科書。学校の教科書は対象者より 1 学年下を目標にしています:9 年生の生物の教科書は、苦戦している生徒が言語によって除外されないように、可読性 8 年生を目標としています。Common Core Lexile バンド(2010)は学年ごとに特定のスコア範囲を提案しています。
- 技術文書。Microsoft、Google、Apple の開発者ドキュメントなどのツールは、チュートリアルコンテンツで 8-10 年生を目標とし、リファレンス資料には高い学年を許可しています。MDN Web Docs の「Plain language」リファクタリング(2018-2020)は平均学年を 14 から 9 に下げました。
- 学術的執筆。ジャーナル記事は通常 14-20+ 年生のスコアで、これは対象者には適切ですが、非専門家には到達できなくなります。科学ジャーナリズム(Quanta、Aeon、The Conversation)は 10-12 年生に翻訳することを目指しています。
可読性スコアリングが本当に役立つ場所
- 患者向けの健康コンテンツ。NHS Digital、Mayo Clinic、WebMD、Healthline はすべて公開前に可読性チェックを実行しています。6 年生目標を逃すと、基本的なリテラシーレベルの米国成人の約半分が除外されます(PIAAC 2017)。病院の再入院率は、退院指示の患者の理解度と相関しています。
- 下書きと改訂。スコアは執筆中のフィードバック信号であり、公開可能なメトリクスではありません。下書きを書き、スコアを付け、最も高い学年レベルの段落(通常は長い文や専門用語)を見つけ、それらを簡素化し、再スコアします。Hemingway Editor(2014)と Grammarly はこのループのために特に学年レベルのフィードバックを追加しました。
- 翻訳とローカライゼーション。翻訳メモリツール(MemoQ、SDL Trados、Phrase)は翻訳前にソーステキストをスコアリングし、シニア言語学者向けに複雑な箇所をフラグ付けします。UNESCO や国連などの国際機関は、言語を超えて対象者のリーチを最大化するために、目標学年 6-8 で翻訳します。
- アクセシビリティと WCAG。WCAG 2.1 成功基準 3.1.5(読解レベル)は AAA です:「低位中等教育レベルより高度な読解能力を必要としない補足コンテンツまたはバージョン」。axe DevTools などのツールはまだこれを自動化していませんが、コンテンツ作成者は可読性ツールを使って手動でチェックします。
- 政府および市民コミュニケーション。米国の Plain Writing Act(2010 年 10 月)、EU の Clearer Communication イニシアチブ、UK Government Digital Service(GDS)スタイルガイドはすべて平易な言語を義務付けています。税金フォーム、有権者情報、給付申請は定期的に 14 年生以上のスコアです, スコアは遵守のリトマス試験です。
- カリキュラムの整合性。特定の学年向けの読み物を選択する際、教師は Lexile または Flesch-Kincaid スコアを Common Core 範囲と相互参照します。図書館カタログシステム(Follett Destiny、Lexile.com)にはスコアが含まれており、生徒は自分の読書レベルで本を自己選択できます。
- SEO とコンテンツマーケティング。Google の有用なコンテンツ更新は、ますます読みやすいコンテンツを好みます。Yoast、Surfer、Clearscope、SemRush はすべて可読性スコアリングを含んでいます。Buffer のコンテンツチームは、Flesch Reading Ease 60-80 がページ滞在時間の延長とバウンス率の低下と相関することを発見しました。
可読性スコアを誤解させるミス
- 100 ワード未満のスコアリング。すべての式は統計的であり、合理的なサンプルが必要です。単一の文や Twitter 投稿のスコアリングは大きな変動を生じます。信頼できる Flesch-Kincaid には 最低 200-300 ワード;SMOG には 最低 30 文(その元の仕様)。
- 単一の式を信頼する。各式には盲点があります。Flesch-Kincaid は長い単語を厳しくペナルティ;Coleman-Liau は単語の頻度を完全に無視;SMOG は積極的に丸めます。3 つのスコアを報告し、中央値または範囲を取ることは、単一の数値より良い信号を提供します。
- ドメイン固有の専門用語を無視。周囲の文が単純であっても、「心筋梗塞」に関する医療記事はグレード 15 になります。式は単語の長さのみを見て、対象者への親しみを見ません。可読性スコアを用語集または初回使用時の説明と組み合わせます。
- 学年レベルの過剰最適化。すべての文を 8 ワードに分割し、すべての多音節語を置き換えると、断片的で幼稚な散文が生成され、実際には大人にとって読みづらくなります。可能な限り低い数字ではなく、対象者の学年レベルを目指します。
- 英語の式を他の言語に適用。Flesch-Kincaid は英語の音節パターン用に校正されています。スペイン語、ドイツ語、フィンランド語、日本語はすべて独自の校正が必要です(スペイン語には Fernández Huerta、ドイツ語には Amstad、一般用途には Anderson の RIX)。翻訳されたテキストで英語の式を実行すると、意味のないスコアが得られます。
- スコアを理解と扱う。可読性式は表面的特徴を測定します。論理的混乱、欠けているコンテキスト、技術的正確性、または構造が意味をなすかどうかを検出できません。グレード 6 の記事でも、一貫性がなければ理解不能になる可能性があります。
- HTML またはマークアップを含むテキストの貼り付け。タグ、URL、コードブロック、特殊文字は文の検出と単語数を歪めます。最初にマークアップを取り除きます(このツールは試みますが、複雑な HTML/Markdown には完璧ではありません)。
その他のよくある質問
意見が一致しない場合、どの式を信頼すべきですか?
あなたのドメイン用に校正された式を選びます。健康と患者教育には、SMOG は米国保健福祉省の推奨です(保守的で, 切り上げの傾向があります)。一般的なウェブコンテンツとジャーナリズムには、Flesch-Kincaid Grade Level は Word、Google Docs、Yoast が使用するものと一致するため、編集ツールとの一貫性が重要です。自動スコアリングには(例えば CI lint)、Coleman-Liau または ARI の方が信頼性が高いです、なぜなら音節をカウントする必要がないからです(これはソフトウェアでは近似的です)。式が 2 学年以上異なる場合、テキストを見てください:外れ値のスコアは通常、特定の段落をフラグ付けします。
これは英語以外のテキストで機能しますか?
英語用に校正された式は、単語あたりの音節数と文あたりの単語数の比率が異なるため、他の言語では意味のない結果を返します。スペイン語には、Fernández Huerta 式を使用してください。ドイツ語には、Amstad または Wiener Sachtextformel。フランス語には、Kandel-Moles 適応。日本語、中国語、韓国語には、「音節」の概念自体がマップしません;代わりに文字密度と JLPT レベル分析が必要です。readability.js のような専門ツールには、別の言語パックがあります。
なぜ Flesch Reading Ease スコアは学年レベルではなく 0-100 のスケールにあるのですか?
Flesch の 1948 年の論文では 0-100 のスケールを使用しました。90-100 =「とても簡単」(4 年生)、60-70 =「標準」(8-9 年生)、0-30 =「とても難しい」(大学卒業生)です。1975 年の Kincaid 再校正は、海軍が読者と取扱説明書を一致させる必要があったため、同じ表面的特徴を米国の学年レベルに翻訳しました。両方の式は同じ入力(音節/単語、単語/文)を使用しますが、出力スケールは異なります。ほとんどの現代のツール(このツールを含む)は両方を報告します。なぜなら、好みの単位を選べる方が比較が簡単だからです。
AI ライティングアシスタントは可読性ツールを置き換えることができますか?
LLM(ChatGPT、Claude、Gemini)は、より単純な表現を提案できますが、可読性を確実に 測定 することはできません。スコアを幻覚し、実行ごとに異なる数値を与え、外れ値を隠す方法で段落を平均化します。決定論的な式(このツールのもの)は毎回同じ答えを返し、編集とスコアの変化を関連付けることができます。正しいワークフロー:LLM を使用して書き直し、その後、式を使用して目標学年レベルが実際に達成されたかどうかを確認します。Hemingway Editor(2014)は、提案と決定論的スコアリングを組み合わせた初期の例でした。
ここでスコアリングするとき、私のテキストはサーバーに送信されますか?
いいえ。6 つの式すべて(Flesch-Kincaid、Flesch Reading Ease、Gunning Fog、Coleman-Liau、SMOG、ARI)はブラウザで実行されます。入力または貼り付け中に DevTools の Network タブを開きます;アウトバウンドリクエストはゼロです。医療下書き、内部企業通信、未公開のジャーナリズム、法律下書き、NDA に従うものすべてに安全です。