
ai-scholar.tech
https://ai-scholar.tech/articles/large-language-models/gpt-lab
新しいUnicode合字、AI屋としては正直やめて!って感じなんですが。
唯でさえ異字体が沢山あって、それを扱うためのエンコードアルゴリズム作るのにどんだけ苦労したか・・・
サンスクリットとかたった256文字の組み合わせで全アルファベット対応なのに、日本語ときたらカナかな漢字それだけで大変なのにさらに合字だと・・・
絶対に存在しない文字作って絵文字的に遊びまくるやつじゃん。