<a href="https://nichidaibunrigojokai.swiki.jp/index.php?cmd=related&page=%E7%8F%BE%E4%BB%A3%E6%97%A5%E6%9C%AC%E8%AA%9E%E5%AD%A6%E3%81%AE%E6%96%B9%E6%B3%95%28%E6%9E%97%E7%9B%B4%E6%A8%B9%29">現代日本語学の方法(林直樹)</a> の編集
右端に[+]の印が付いた帯は、タップまたはクリックをすると、閲覧できます。
[
ホーム
|
リロード
|
新規
]
サイト内検索
:
[
差分チェッカー
]
[
アップローダー
]
【楽天スーパーDEAL】毎日更新・最大50%ポイントバック!!(広告)
Tweet
Top
> 現代日本語学の方法(林直樹)
現代日本語学の方法(林直樹)
の編集
***第四講目の内容 [#ya2597c9] >''コーパス'' ある言語の研究の為に、その言語で実際に用いられた研究を 大量に偏りなく集め、コンピュータで検索・分析できるように整理・構造化した言語データベースのこと。 //内省の確認 //文法性の判断(非文・適文) //レジスター差 //hayashi.naoki45@nihon-u.ac.jp //123456789 >''課題'' [[少納言>https://shonagon.ninjal.ac.jp/]]で自動詞・他動詞のペアで「~ガ」「~ヲ」を入れ替えてそれぞれ検索し、検索数を Word・ドキュメントファイルにまとめる。できれば結果について考察する。 ※思いつく自他動詞のペアがあればそれらを調べてみる。 提出期限:5月12日の23:59
''■[[日本語学の方法]]'' ''■文献日本語学の方法''|[[文献日本語学の方法(杉山俊一郎)]] ''■現代日本語学の方法1''|現代日本語学の方法(林直樹) ''■現代日本語学の方法2''|[[方言の研究(林直樹)]] #contents |BGCOLOR(#555):COLOR(White):200|520|c |BGCOLOR(#fc2):COLOR(Black):''分類''|''選択(国文学科)/日本語教育選択''| |区分|[[国文学科]]科目| |履修形態|一般(人数過多の場合は抽選)| |履修条件|二年生以上&br;初回の授業で課題を提出した受講者のみ履修可とする。| |単位数|2| |講師|[[林直樹]]| |学位等|学士(文学)| *概要 [#Gaiyou] [[日本語教育コース>日本語教育コース/日本語教育課程]]の選択科目でもある。 令和7年度に「現代日本語学の方法1」から「現代日本語学の方法」へ改称。 #br 各種データによって日本語を分析するための基本的な考え方の理解を目的とする。 Blackboardを活用し、毎回課題を提出する。そのため、学生用アカウントを準備しておくこと。 本講義はパソコンによる操作を想定して授業を行う。Excelのような表計算ソフトも用いることを予定しているため、 スマートフォンなどのモバイル環境にしかない受講生は、パソコンが使える環境を整備することが望ましい。 #br 成績割合は、授業資料では出席(20%)・課題(40%)・レポート(40%) シラバスではレポート(45%)、授業参画度(10%)、課題(45%)としている。 教科書はない。 #br この科目は文理学部(学士(文学))のディプロマポリシーDP2,3,4,5及びカリキュラムポリシーCP2,3,4,5に対応している。 *講師の印象 [#Inshou] *中納言の使い方 [#jcdac1e4] この授業では[[中納言>https://chunagon.ninjal.ac.jp/]]を多用するので、使い方を解説した動画を載せておきます。参考になれば幸いです。 検索技術の初級〜中級はこの授業を受けるに当たって、出来た方が良いので一つにまとめています。 余裕があれば、全ての技術を修得するのが望ましい。 #region(検索(初級〜中級)) ''検索(初級〜中級)'' ・''初級'' #youtube(https://www.youtube.com/watch?v=JRbZquA9bcQ) #youtube(https://www.youtube.com/watch?v=nL5DNAu8XgE) #youtube(https://www.youtube.com/watch?v=_kzpX7Ca1ds) ・''中級'' #youtube(https://www.youtube.com/watch?v=0NwFgnz2PU0) #youtube(https://www.youtube.com/watch?v=cf_aGWedcuI) #youtube(https://www.youtube.com/watch?v=TyA29zHwRRQ) #endregion #region(ピボットテーブルの作成・レジスターの比較) ''ピボットテーブルの作成・レジスターの比較'' ・''ピボットテーブルの作成'' #youtube(https://www.youtube.com/watch?v=ecxFtJ6Civ8) #youtube(https://www.youtube.com/watch?v=KPNUwooY5pc) ・''レジスターの比較'' #youtube(https://www.youtube.com/watch?v=ceOoRbOB2WI) #endregion #region(特定の表現の抽出) ''特定の表現の抽出'' #youtube(https://www.youtube.com/watch?v=7-NXomO4oyc) #youtube(https://www.youtube.com/watch?v=KV5sDGYZnMM) #youtube(https://www.youtube.com/watch?v=xWyZKZD8WFE) #youtube(https://www.youtube.com/watch?v=rK3sSYktihg) #endregion #region(複数のコーパスを用いた検索) ''複数のコーパスを用いた検索'' #youtube(https://www.youtube.com/watch?v=MKRcV83z-iA) #endregion *令和八年度(2026年度) [#h81d5434] 前期に開講。 現代日本語学の方法2(方言の研究)は後期に開かれる。 #style(class=submenuheader){{ **前期 [#yf8e18f0] }} #style(class=submenu){{ |BGCOLOR(#555):COLOR(White):200|520|c |BGCOLOR(#fc2):COLOR(Black):授業形態|対面授業| |日程/教室|金曜日 四限目/3207教室(三号館二階七番教室)・3208教室(三号館二階八番教室)| 3207教室と3208教室で開講される。 ***第一講目の内容 [#q7169e6f] 授業の説明がほとんど。席が足らず、壁際に十数名が座り込むことになった。 >今日の課題 -「国立国語研究所 中納言」を検索し、ユーザー登録画面から登録を行う。 https://chunagon.ninjal.ac.jp/useraccount/register -「登録コードをショートメッセージで受け取る」を選択 -利用規約を確認してから、用途に「授業で使用するため」と記入して、すべてのコーパスの利用を申請する。 -(取得していない場合)Gmail のアカウントを取得する。 今後の授業で用いることがあるため、アカウント(メールアドレス)・パスワードはきちんと記録・管理しておくこと -Canvas に掲げられている「第 1 回課題」に情報を入力する。(締切:4/12 23:59まで) ***第二講目の内容 [#vd171ebb] #region(ことばの分析) ''ことばの分析'' >''社会言語学的な観点'' →バリエーションの研究 数量的な研究と親和性が高い。 ⇔言語能力の把握(生成文法) ⇔正しいか否か(国語・日本語教育) |~談話|文よりも大きい単位で、複数の文が連続するひとまとまりの内容や構造を持った言語表現| |~談話分析|談話の関係者・内容の連続性や構成、言語表現としての形態や機能に注目する分析| >打ち言葉 文章+諸要素(絵文字・顔文字,スタンプ,画像) 相互行為が盛ん 新しいものやメディアに特化した言語表現 |~新規言語事象|新しいメディアが現れると新しい表現が生まれる。| |~ニセ方言|例:関西出身でないのに関西弁を使う。| >研究 -メールの言語表現についての研究 メールに出現する要素→終助詞の有無・助詞の省略・言い淀み -親密度と顔文字の出現数の研究 親密度高いほど出現 >LINE分析の一例 大きく二つに分かれる。 |母中心タイプ|父中心タイプ|h |質問・頼み事に家族が応答|天気の話題・何処へ行ったか(一人で終了)| >''LINE分析方法'' ①送信日:当該のメッセージが送られた日にちを入力する ②送信時間:当該のメッセージが送られた時間を入力する ③グループ:当該のメッセージがやり取りされたグループ名を入力する (仮名[Aグループ、Bグループなど]を使用する) ④送信者:当該のメッセージを送った人物を入力する (仮名[Aさん、Bさんなど]を使用する) ⑤自身との関係性:当該のメッセージと自身との関係性を入力する (分析観点によって入力方針が異なる) ⑥メッセージ(本文):メッセージを入力する ⑦絵文字有無:絵文字の有無を入力する。有:1、無:0 など ⑧スタンプ有無:スタンプの有無を入力する。有:1、無:0 など #endregion > ''課題'' |~課題提出期限|4月19日 23:59まで| |~ファイル名|学籍番号・名前・課題 2| (LMSのBlackboard「教材」→「課題」→「第2回課題」に提出) >> 課題のWord・ドキュメントファイルに記載する情報 +分析グループそれぞれの名前(仮名可) +各グループにおける分析メッセージ数(各人のメッセージ数もできれば記載) +分析結果 ***第三講目の内容 [#d56df98b] #region(会話分析) ''会話分析'' -会話分析 「話し言葉」そのものの特徴や構造を把握する。 言語情報に付随する要素の分析・会話の規則性の分析→日常的なコミュニケーションの分析 会話は、独話や対話に分類できる。 |>|言語情報のタイプ|h |言語情報|言葉| |パラ言語情報|イントネーション,リズム| |非言語情報(ノンバーバル情報)|身振り手振り,フィラー(「あのー」や「えっと」),言い淀み(「あ、あいつだ!!」など),息遣い| //>''会話分析の方法'' //適当に休むところがあれば相談したいなと思って //そうですか >''独話(朗読)音声データの書き起こし例'' 今、ロンドンに着いたところですが、私の荷物はローマに行ってしまいました。 私は糖尿病なので、&ruby(あす){明日}にはどうしてもその荷物が必要です。 早速に、荷物の所在を調べてもらえるよう、責任者の&ruby(かた){方}に頼んでください。 その間、当座の薬が必要です。どこか病院に連絡を取ってもらえませんか。 >''対話音声データの書き起こし例'' 甲:いらっしゃいませー 乙:こんにちは 甲:こんにちは 乙:あのー、今年の夏にですね、あのー、ハワイに家族旅行に行こうと思っているんですが、 甲:あー、そうですか、はい。えーっと、パンフレット、お決まりのパンフレットはございますか。 乙:えーとですね 甲:ええ 乙:このパンフレットは持っているんですけれども 甲:はい 乙:えーと、人数...が大人三人、子供が一人なんです。 甲:ええ 乙:ええ、ああ、適当に安い所があれば... 甲:はい 乙:相談したなと思いまして 甲:あー、そうですか、 #br Wordを使用した文字起こしの方法: https://jp.plaud.ai/blogs/blog/word-transcription?srsltid=AfmBOopodgYz8SV63tLehKBP0TnmWqb1tW_ixKnNwsgKv74FII7OnAL6 #endregion // >''課題(データ分析)'' 自身が選んだ二種の音声の文字起こしデータを作成し、発話数や文字数といった何等かの観点から考察する。 二つの音声の違いを指摘出来る場合はする。数量的に示せると尚良い。 何の音声データかといった情報やURLは書き留めておく。 フィラーにタグ(「あー」→[F あー])を付けると良い。独自のタグを付けられる人は付けてみるように。 #br 提出期限:4/26 ファイル名:学籍番号・名前・課題 3 ***第四講目の内容 [#ya2597c9] >''コーパス'' ある言語の研究の為に、その言語で実際に用いられた研究を 大量に偏りなく集め、コンピュータで検索・分析できるように整理・構造化した言語データベースのこと。 //内省の確認 //文法性の判断(非文・適文) //レジスター差 //hayashi.naoki45@nihon-u.ac.jp //123456789 >''課題'' [[少納言>https://shonagon.ninjal.ac.jp/]]で自動詞・他動詞のペアで「~ガ」「~ヲ」を入れ替えてそれぞれ検索し、検索数を Word・ドキュメントファイルにまとめる。できれば結果について考察する。 ※思いつく自他動詞のペアがあればそれらを調べてみる。 提出期限:5月12日の23:59 ***第五講目の内容 [#n40814cf] >''ヲの違い'' ペンを落ちる(目的格のヲ→言えない) 崖を落ちる(場所格のヲ→言えそう) //内省の確認 //レジスター差 //確率的言語 //>''中納言による日本語の分析'' |>|CENTER:BCCWJのレジスター|h |出版サブコーパス(約3,437万語)|書籍・雑誌・新聞| |図書館サブコーパス(約3,038万語)|書籍| |特定目的サブコーパス(約4,017万語)|白書・教科書・広報誌・ベストセラー・Yahoo!知恵袋・Yahoo!ブログ・韻文・法律・国会会議録| レジスターとは、発信者の属性や場面のこと。 >''課題'' ある語を調べ、レジスターごとにどのような出現傾向の違いがあるかを分析し、分析結果と考察を Wordファイルあるいはドキュメントファイルに記載して、LMSへ提出。ファイル名は「学籍番号・名前・課題 5」 ➢ 検索機能を活用しても、ピボットテーブルを活用しても可 出現率=個数÷総語数 #br 提出期限:5/17(日)23:59 ***第六講目の内容 [#pf1bfaec] &size(20){''&color(Red){休講};''}; ***第七講目の内容 [#b944735e] コーパスは言語をある単位で区切っていることが多い。 その最小単位は形態素である。 形態素(morpheme)=言語単位の一つで、意味を有する最小の単位のこと #br #region(ピボットテーブルの使い方) #youtube(https://www.youtube.com/watch?v=3v9q1FGc-wk) #endregion >''[[Web茶まめ>http://chamame.ninjal.ac.jp/]]'' 各時代語に対応した辞書のある形態素解析器 解析率は99.5%(長い文章だと100語に1語は誤解析) -解析結果の確認箇所 --頻出語・稀少語の確認 --品詞の割合 --語種(和語・漢語など)の割合 >''課題'' 最低2種類の文書の語彙表を出し、何らかの観点で比較・考察する。 期限:5月31日の23:59 ***第八講目の内容 [#e07d9aed] >''TTR(Type-Token Ratio:異なり語数と延べ語数の比)'' テキスト分析において文章の「語彙の豊かさ」や「多様性」を数値化するための指標。 TTR=異なり語数(Type)÷延べ語数(Token) >''MVR(Modifier-Verb Ratio:修飾語と動詞の比率)'' 文章における修飾語(ありさま)と動詞(動き)のバランスを数値化し、文体の特徴を評価するための指標。 数値が高い程、ありさま描写的 |~M|形容詞・形容動詞・副詞・連体詞| |~V|動詞| MVR=M÷V×100 >''品詞が関係する文章指標(樺山・寿岳 1963)'' -名詞が多い文章 要約的文章(骨組みを述べる) -動詞・形容詞が多い文章 描写的文章 --形容詞が多い →ありさま描写 --動詞が多い →動き描写 >''課題'' 『こころ』と『ごんぎつね』(出来るのならば、それ以外の文章も)を形態素解析で分析した上で 各文章の名詞比率・MVRを計算し、それぞれの文章の特性を把握する。 ***第九講目の内容 [#wb3a6986] //nichidaihoho26@gmail.com //N1ch1da1hoho26? #region(アンケートによる日本語の分析) ''アンケートによる日本語の分析'' 良く行われる調査方法 |~標本の問題|誰に聞くかで結果が変わる。| |~サンプリング(標本の抽出)の問題|偏った人に聞いていないか| リサーチ・クエスチョン(何を尋ねるか)は仮説を持って行うと良い。 #br |~質問調査法のメリット|「知りたいこと」について均質な回答(「はい/いいえ」など)を得られる。| |~|低コスト| |~質問調査法のデメリット|「知りたいこと」が明確でなければ良くわからない結果・データになる。| |~|調査方法・ワーディングが妥当かどうかの検討が必要| |~|均質でない回答が出現する。| [[田中ゆかり]](2004)による。 >''調査できること'' -言語意識 -言語行動 -言語実態 非文の判定・特定形式が使われていないか →存在しないことの証明 >''調査票作成時に気をつけること'' -質問 --なるべく簡潔でわかりやすく。 --誘導的文言は避ける。 --二重質問をしない。 例:「AやBを使いますか」 -回答(選択肢) --単一回答・複数回答・記述式回答かを決める。 複数回答は処理が少し複雑 記述式回答はそのまま集計できない。 --あてはまらない回答がないようにする。 --頻度・程度を聞く場合は、段階設定に気をつける。 #endregion >''課題'' [[グーグルフォーム>https://docs.google.com/forms/create?hl=ja]]でアンケートを作る。フォーム名は学籍番号と氏名にすること。 授業中に指示されたアカウントにログインして作るのが望ましいが、 ログイン出来ない場合は自分のアカウントで構わない。 #br 提出期限:6/14の 23:59 まで ***第十講目の内容 [#kb3fc404] >''アンケートで出来ること'' -クロス集計(多変量解析) --質問間の相関関係 質問項目×質問項目 --属性間の比較・対照 質問項目×属性項目 ***第十一講目の内容 [#z27e3e68] 集約版アンケートに答えた後、アンケート結果(自分が作問した部分)について分析 ***第十二講目の内容 [#i6ce3998] >''言語地図'' 言葉の特徴を地図に纏めたもの 言葉に対応する記号を決めて地図に落とし込む手法が主流。 蝸牛考(方言周圏論)の図が有名。 #br 地理的特徴を把握することで言語の変化や歴史が分かる。 >''色々な言語地図・言語地図データベース'' -日本言語地図(LAJ) -方言文法全国地図(GAJ) -新日本言語地図(FPJD) -[[日本言語地図データベース(LAJDB)>https://www.lajdb.org/TOP.html]] -[[全国方言分布調査(FPJD)・新日本言語地図(NLJ)>https://www2.ninjal.ac.jp/hogen/dp/fpjd/fpjd_index.html]] >''課題'' +LAJ の「かぼちゃ」ファイルを使って、「カボチャ」という語形を使っている地域と「ナンキン」という語形を使っている地域がどこに分布するのか、別々のマーカーで表示する(元ファイルを編集し、それぞれの語形のデータを作るとわかりやすい地図になる)。 +FPJD の「かぼちゃ」ファイルを使って、「カボチャ」という語形を使っている地域と「ナンキン」という語形を使っている地域がどこに分布するのか、別々のマーカーで表示する。 +表示した結果をスクリーンショットし、Word ファイルに貼り付ける。 +(できれば)貼り付けた Word ファイルの結果からどのような地域差がみられるのかを考察する。また、①と②の結果を比較する。 Googleマイマップの作り方は[[こちら>https://www.google.com/intl/ja_ALL/earth/outreach/learn/visualize-your-data-on-a-custom-map-using-google-my-maps/]] ***第十三講目の内容 [#j0ba6ad4] ***第十四講目の内容 [#s049e3aa] ***第十五講目の内容 [#kc2ef77b] }} *コメント [#comment] #pcomment(,reply,20,)