あらゆるテキストの単語数と文字数を数える方法
テキストに含まれる単語数や文字数を正確に知ることは、思っているよりも頻繁に重要になります。SNSの投稿には文字数制限があります。学術論文には単語数の指定があります。SEOのメタディスクリプションは特定の範囲に収める必要があります。メールの件名さえ、特定の長さでパフォーマンスが上がります。ブラウザベースのカウンターは、入力するそばからすべてをライブで表示し、サーバーへのアップロードは一切必要ありません。
プラットフォーム別の文字数制限
| プラットフォーム | 制限 | カウント対象 |
|---|---|---|
| Twitter / X投稿 | 280文字 | スペースを含むすべての文字 |
| Twitter / X Premium | 25,000文字 | 「ロングポスト」ツイート1件あたり |
| Instagramキャプション | 2,200文字 | すべての文字 |
| Instagram自己紹介 | 150文字 | プロフィールで見える部分 |
| LinkedIn投稿 | 3,000文字 | すべての文字 |
| LinkedIn見出し | 220文字 | プロフィールの名前の下 |
| TikTokキャプション | 4,000文字 | 動画投稿1件あたり |
| Facebook投稿 | 63,206文字 | ただし80文字未満が最も反応が良い |
| Bluesky投稿 | 300文字 | スペースを含む |
| Mastodonトゥート | 500文字 | デフォルト。一部のインスタンスはより多くを許可 |
| メタディスクリプション(SEO) | 155から160文字 | 検索結果に表示される |
| タイトルタグ(SEO) | 50から60文字 | SERPでこれを超えると切り詰められる |
| SMSメッセージ | 160文字 | 1セグメントあたり |
| メールの件名 | 50から60文字 | モバイル表示向け |
| YouTubeタイトル | 100文字 | 完全表示のため |
| YouTube説明文 | 5,000文字 | 最初の125文字が「もっと見る」なしで見える |
| Redditの投稿タイトル | 300文字 | サブレディットがより低い制限を設けることがある |
| Discordメッセージ | 2,000文字 | 1メッセージあたり。長いものは複数に分割 |
| WhatsAppメッセージ | 65,536文字 | チャットでは事実上無制限 |
単語数と文字数をカウントする手順
- テキストを貼り付けまたは入力: カウンターにテキストを入力します。統計は入力中に即座に更新されます。
- 統計を確認: 単語数、文字数(スペースありとなし)、文の数、段落の数、推定読書時間を確認します。
- 結果をコピー: 「統計をコピー」をクリックして、分析をクリップボードに保存します。
単語数カウントの簡単な歴史
単語数のカウントはコンピューターより何世紀も前から行われていました。中世の写字生は支払いの見積もりのために単語を数えました(一部の修道院では「行」単位、他では「ページ」単位で支払われました)。英語で単語数を指定した最初のスタイルガイドはおそらく1918年のStrunk & Whiteの「The Elements of Style」で、典型的な段落の最大値として250から300語を設定しました。
単語数のカウントは、タイプライターによって機械的になりました。標準的なタイプライター原稿のページは約250語でした(12ポイントのCourier、ダブルスペース、1インチの余白)。これは今でも出版業界の「標準原稿ページ」で、小説家は単語ごとに書籍の前払いを交渉し、出版される1ページは原稿の約250語に対応します。
Microsoft WordはWord 95(1995年)に組み込みの単語カウンターを追加し、手動で追跡するものから即座のものへと変えました。Webベースの単語カウンターは1990年代後半に登場しました。今日、すべての執筆ツール(Google Docs、Notion、Obsidian、VS Code、Word、Pages)はライブの単語カウントを備えており、専用のブラウザベースカウンターは、エディタなしでテキストを貼り付ける場面のために存在します。
基本的なカウントを超えて
良い単語カウンターは数字以上のものを提供します:
読書時間: 1分あたり約200から250語と推定されます。ブログ記事や記事に役立ち、読者が何にコミットしているかが分かります。
キーワード密度: 特定の単語が全単語の何%を占めるか。SEOで重要です。ターゲットキーワードが自然に(密度1から2%で)現れ、詰め込みにならないことが目標です。
文と段落のカウント: 書き物の構造を判断するのに役立ちます。短い段落(2から4文)は画面で読みやすくなります。
平均単語長: 平均単語長が短いほど、通常は読みやすくなります。Hemingwayは1単語あたり平均4.2文字、学術論文はしばしば5.5文字以上です。
最も使われる単語: 頻度順に上位の単語を表示します。繰り返しを発見したり、自分の「特徴的な」単語(作家はある単語を無意識に使いすぎる傾向があります)を見つけるのに役立ちます。
可読性スコア: Flesch-Kincaid(米国)、Gunning Fog、SMOG、Coleman-Liauは学年レベルの推定を与えます。ほとんどの新聞は8年生の読解レベルを目指し、企業文書はしばしば12以上に達します。
何が「単語」としてカウントされるか
単語の定義は、思っているよりも変動します:
- 空白区切り: ほとんどのカウンターはテキストをスペースで分割します。「It's」は1語、「well-being」は1語(ハイフンが繋ぐ)、「U.S.A.」は1語(スペースなし)です。
- 複合語のカウント: 一部のスタイルガイドはハイフン語を2語としてカウントします(「twenty-five」を2語)。ほとんどのカウンターはそうしません。
- 数値: 「1,000,000」は通常1語です。「1 million」は2語です。
- 頭字語: 「FAQ」は1語、「F.A.Q.」も1語(内部スペースなし)です。
- 絵文字: 通常それぞれ1語ですが、一部のカウンターは0(非テキスト)として、または書記素クラスターサイズで(肌の色の修飾子では4以上のコードポイントになりうる)カウントします。
- CJK言語: 中国語、日本語、韓国語のテキストは単語間にスペースを使いません。純粋な文字数カウント(または文字ペアカウント)が単語カウントを近似します。一部のカウンターは適切な単語分割を使い、ほとんどは文字数にフォールバックします。
ツール間で一貫した単語数を得るには、同じテキストを複数のカウンターに貼り付け、ターゲットプラットフォームのカウントと一致するものを選びます。
Unicodeと絵文字の注意点
モダンなテキストカウントはUnicodeを正しく扱う必要があります:
- 結合文字: 「é」は1つのコードポイント(U+00E9)または2つ(U+0065 + アキュートアクセント結合U+0301)でありえます。両方とも同じように表示されます。素朴な文字カウントはエンコーディングに応じて1または2を返します。
- サロゲートペア: 絵文字や珍しい文字は2つのUTF-16コード単位を使います。JavaScriptの
.lengthは「😀」に対して2を返しますが、[...str].length(1を返す)を使えば1になります。Twitter、Discord、ほとんどのプラットフォームは書記素クラスターでカウントします。 - 肌の色の修飾子: 👍🏽はユーザーが認識する1文字ですが、2つのコードポイント(親指 + トーン修飾子)です。👨👩👧👦のような家族絵文字は7以上のコードポイントになりえます。
- ゼロ幅結合子: 👨💻(男性 + ZWJ + ラップトップ)のような絵文字シーケンスはゼロ幅結合子を使います。コードポイントで分割すると過剰カウントになります。
- 右から左へのテキスト: アラビア語とヘブライ語は、制限にカウントされるが目には見えない方向制御文字を追加します。
良いカウンターはIntl.Segmenter API(2022年以降、ブラウザネイティブ)を使って、これらすべてを正しく扱います。
よくある落とし穴
- Twitter Premiumの「ロングポスト」ツイートは扱いが異なる: 25,000文字制限ですが、メディア(画像、動画)は無料ティアでは制限にカウントされ、有料では影響しません。
- SMSのマルチセグメントメッセージはコストが増える: 160文字を超えるSMSは複数セグメントに分割され、それぞれ個別に課金されます。マルチセグメントをフラグするカウンターを使ってください。
- GSM-7 vs Unicode SMS: GSM-7エンコーディングのSMSはセグメントあたり160文字を許可します。Unicode(非ラテン文字を含む)は制限をセグメントあたり70文字に下げます。1つの絵文字やアクセント付き文字がSMSコストを倍増させることがあります。
- 空白のみの「空の」テキスト: スペース、タブ、改行のみのテキストは文字数をカウントしますが、単語数はゼロです。誤って貼り付けた空白を発見する簡単な方法です。
- Markdownマークアップがテキストとしてカウントされる: 単語カウンターは通常、生のMarkdownをカウントし、
**bold**マーカーや[link text](url)構文を含みます。プラットフォームがMarkdownをプレーンテキストにレンダリングする場合、見える文字数はソースのカウントより短くなります。 - 隠れた追跡文字: スパム対策ツールは時折、コピーペーストを検出するため、見えない追跡文字(ゼロ幅スペース、ゼロ幅結合子)を追加します。これらはプラットフォーム制限にカウントされます。
使いこなしのヒント
- まず書いて、後でカウント: 文字数制限に最初の下書きを縛らせないでください。自由に書いて、後で整えて収めます。
- 投稿前に確認: 公開前にSNS投稿をカウンターに貼り付けます。文の途中で切れるのはプロフェッショナルに見えません。
- ブログ記事には読書時間を使う: 記事に「5分で読める」と追加すると、読者の期待値を設定でき、エンゲージメントを高められます。
- 見えない文字に注意: 一部のテキストエディタは制限にカウントされるが目には見えない文字(ゼロ幅スペース、ノーブレークスペース)を追加します。文字カウンターはこれらを明かします。
- コンテンツタイプ別の目標単語数: 長いブログ記事には1,500から2,500語(SEOの最適範囲)、ニュースレター記事には500から800語、製品説明には300から500語、広告の見出しには50から150語。
- 読解レベルチェッカーと組み合わせる: 単語をカウントするだけでは、書き物が明確かどうか分かりません。可読性スコア(Flesch-Kincaid、Hemingway)は、テキストが読者の読解レベルに合っているかを明かします。
プライバシーと機密テキスト
単語カウンターは完全にブラウザ内で動作します。貼り付けたテキスト、生成された統計、カスタム設定はすべてデバイス上に留まります。サーバーへのアップロード、ロギング、第三者との共有は一切ありません。
これはテキスト入力がしばしば機密だからです。クライアントへのメール下書き、機密の法的通信、社内の文書、個人的な日記、未発表書籍の章の下書きなど。クラウドの単語カウンターはサーバーリクエストにテキストをログとして記録し、ときには「改善」や分析のために保持します。機密性の高い書き物には、ブラウザ専用のカウンターは露出ゼロです。貼り付け、カウントを見る、タブを閉じる、消える、それだけです。
ブラウザベースのカウントは、ページを一度読み込めばオフラインでも動作するため、出張中や接続性の低い環境で書くときに役立ちます。
よくある質問
スペース有りと無しの文字数の違いは何ですか?
スペース有りはスペースを含むすべての文字をカウントします。スペース無しは文字、数字、句読点だけをカウントします。プラットフォームによって採用方法が異なり、Twitter / X や SMS はスペースもカウントします。
読了時間はどのように計算されますか?
読了時間は、平均的な大人で 1 分あたり 200〜250 単語として推定されることが一般的です。1,000 単語の記事なら、おおよそ 4〜5 分かかります。
カウンターは他の言語でも動作しますか?
はい。単語と文字のカウンターはすべての言語と Unicode 文字をサポートしており、中国語、日本語、韓国語、アラビア語、絵文字、アクセント付き文字も含まれます。
テキストはどこかに保存・送信されますか?
いいえ。すべてのカウントはブラウザ内で行われます。テキストがデバイスから出ることはありません。