>> 自然の科学 >  >> 生き物

数十億のツイッターの言葉の分析は、アメリカの英語がどのように発展しているかを明らかにしています

タイトル: 数十億のツイッターの言葉の分析は、アメリカの英語がどのように発展しているかを明らかにしています

要約:

この研究は、2008年から2020年の間にTwitterに投稿された数十億の単語からのデータからのデータを使用して、アメリカの英語開発の大規模な分析を提供します。新しい単語の出現、古い単語の衰退、単語の意味のシフトなど、単語の頻度と使用パターンが時間とともにどのように変化するかを調べます。私たちの調査結果は、言語の動的な性質に光を当て、アメリカ英語の進化を形作る文化的、社会的、技術的要因に関する洞察を提供します。

キーワード: アメリカ英語、ツイッターデータ、言語の変更、単語頻度、セマンティックシフト

はじめに:

言語は、時間とともに常に変化する動的な現象です。新しい単語が導入され、古い単語が使用されなくなり、既存の単語は意味が変わる可能性があります。これらの変化は、文化的、社会的、技術的、環境的変化など、さまざまな要因の影響を受けます。

近年、大規模なデジタルテキストデータが可用性により、研究者は前例のない詳細で言語の変化を研究することができました。特に、Twitterは、言語の使用をリアルタイムで分析するための豊富なデータソースを提供します。何百万人ものユーザーがプラットフォームに積極的に投稿しているため、Twitterはアメリカの英語の現在の状態とそれがどのように進化しているかを垣間見ることができます。

方法論

TwitterでのAmerican Englishの開発を分析するために、2008年から2020年の間に投稿された数十億の単語のデータセットを収集しました。最初に、英語以外の単語、句読点、およびURLを削除してデータを前処理しました。次に、テキストを単語にトークン化し、毎年各単語の頻度をカウントしました。

時間の経過に伴う単語周波数の変化を追跡するために、単語周波数の変化率の割合の変化率として定義された単語周波数成長率を計算しました。

さらに、単語の埋め込み手法を使用して、単語間のセマンティックな類似性をキャプチャしました。事前に訓練された単語埋め込みモデルを使用して、単語ベクトル間のコサインの類似性を計算し、時間の経過に伴う単語の意味関連を比較しました。

調査結果:

1。新しい単語の出現:

調査期間中、Twitterで何千もの新しい単語が現れたことがわかりました。これらの言葉の多くは、技術の進歩と文化的変化の急速なペースを反映した、新しいテクノロジー、ソーシャルメディア、大衆文化に関連していました。

2。古い言葉の衰退:

特定の単語は、時間の経過とともに頻度の減少を経験し、使用法または関連性の変化を示しています。いくつかの衰退した言葉は、時代遅れの技術、ファッションの傾向、または政治的人物に関連していました。

3。セマンティックシフト:

また、私たちの分析は、時間の経過とともに特定の単語の意味の意味的な変化を明らかにしました。たとえば、「文字通り」という言葉はもともと「文字通りの意味で」を意味していましたが、Twitterでの使用はしばしば強調や誇張を伝えました。

4。社会的および文化的出来事の影響:

主要な社会的および文化的イベントは、言語の使用に大きな影響を与えました。たとえば、「selfie」という言葉は、携帯電話の写真撮影の上昇とInstagramのようなソーシャルメディアプラットフォームの使用後、頻度が劇的に増加しました。

結論:

数十億のツイッター語の分析は、アメリカの英語の動的な性質と、それが時間の経過とともにどのように進化するかについての洞察を提供します。新しい言葉が現れ、古い言葉が衰退し、言葉の意味は、文化的、社会的、技術的な変化のために変化する可能性があります。 Twitterデータは、リアルタイムの言語の変化を研究するための貴重なリソースとして機能し、研究者が前例のない詳細で言語の進化を追跡できるようにします。

意味:

この研究の結果は、歴史的言語学、社会学、文化研究など、さまざまな分野に影響を与えます。アメリカの英語の進化を理解することは、社会的変化、文化的傾向、言語ユーザーの進化するニーズに関する貴重な情報を提供することができます。

  1. Mirco Evolutionとは何ですか?
  2. 最も魅力的な22の野生動物
  3. なぜカニは泡を吹くのが好きなのですか
  4. ヒトとカエルの血液細胞の違い
  5. 細胞シグナル伝達でATPではなくGTPを使用するのはなぜですか?
  6. 専門家は、オピオイドが有名人の腸を破裂させた方法を説明します