NISHIO Hirokazu
[Translate]
範囲のアノテーション
コーパス
中の
範囲
の
アノテーション
はどうするのが良いか
例えば
書籍コーパス
中の「この範囲はソースコード」
範囲前後に特定の(出現しなさそうな)文字を入れる案
Unicode私用領域
とか
人間に入力しやすくするツールが必要
範囲選択してワンクリックorショートカットってのがいいね
人の目で直接読めない
範囲前後に特定の文字列を入れる
<span class='code'>...</span>
普通のHTMLパーサで取り除けるから良い
普通のHTMLパーサでアノテーションされた範囲だけ取り出すこともできる
若干冗長だが
これでいいのでは
関連
マイクロフォーマット - Wikipedia
マイクロフォーマット
Tweet
Related Pages
Unicode私用領域
→
ハンドル
×
取っ手
×
エンジニアの知的生産術
×
(column)_パターンに名前を付けること
×
(4.5.3.3)_思考の道具を手に入れる
×
作られつつある言葉
×
液体が容器に入っているメタファー
×
概念を操作するためのハンドル
×
オブジェクトへのポインタ
×
ポインタ
×
リソースロケータ
×
指差し
×
自然言語処理
×
オブジェクト
×
単語
×
表現
×
知識
×
コーパス
×
指し示す
×
scrapboxコーパス
×
本の分散表現
→
概念のハンドル
→
コーパス
×
事後的
×
精錬
×
スラグ
×
不完全なコーパス
×
言語化
×
行動
×
トリガー
×
雑なコーパス
×
雑
→
コーパス精錬
→
概念のハンドル
×
コーパス
×
ハンドル
×
ウィンドウハンドル
×
取っ手
→
重要概念のハンドル
→
positional_encoding
×
時間軸上
×
自然な周期
×
自分の過去のアウトプット
×
コーパス
→
日時エンコーディング
→
書籍コーパス
×
直接引用モデル
×
チャットボット
×
キーフレーズ出現
→
チャットボット2018-09-30
→
自然言語処理
×
書籍コーパス
→
書籍は目次と索引の言語モデルが特殊
→
数式
×
コード
×
Unicode私用領域
×
scrapboxパーサ
→
数式とコードの文字化
"
Engineer's way of creating knowledge
" the English version of my book is now available on
[Engineer's way of creating knowledge]
(C)NISHIO Hirokazu / Converted from
[Scrapbox]
at
11/23/2025, 5:40:35 PM
[Edit]