公开模型一览¶
版本说明¶
一级版本
公开版本1(luna_pub):高考
公开版本2( luna_pub_large):高考 + 地区试题
二级版本:
小科(Chinese,Math,English,History,Geography,Politics,Biology,Physics,Chemistry)
大科(理科science、文科literal、全科all)
三级版本:【待完成】
不使用第三方初始化词表
使用第三方初始化词表
模型命名规则:一级版本 + 二级版本 + gensim_luna_stem + 分词规则 + 模型方法 + 维度
Examples:
全量版本-全学科的D2V模型路径:
`/share/qlh/d2v_model/luna_pub/luna_pub_all_gensim_luna_stem_general_d2v_256.bin`
(备注:一个D2V模型含4个bin后缀的文件)
模型训练数据说明¶
当前【词向量w2v】【句向量d2v】模型所用的数据均为 【高中学段】 的题目
测试数据:[OpenLUNA.json]
- 当前提供以下模型,更多分学科、分题型模型正在训练中,敬请期待
“d2v_all_256”(全科),”d2v_sci_256”(理科),”d2v_eng_256”(文科),”d2v_lit_256”(英语)