语料
首页
博客
论坛
聚能聊
问答
直播
活动
主题
登录账号
注册账号
阿里云
>
云栖社区
>
主题地图
>
Y
>
语料
全部
博客
免费套餐
上云实践机会
校园扶持
助力学生成长
API服务
覆盖海量行业
语料 相关的博客
语料准备
之前查找了很多资料,发现语料准备这块的方法论很有限,在我看来如果说AI是个学生,语料其实是教科书,是知识的海洋,是AI的粮食,非常重要。 本文主要探讨有充分的语料基础后对语料进行预处理的办法。 1,众包打标签 2,手工规则提取 关键词特征,使用数据库进行批量
ebxinxi
6年前
649
语料库资源————(一)
国内可用免费语料库(凡没有标注不可用的链接均可用) (一) 国家语委 1.国家语委现代汉语语料库http://www.cncorpus.org/ 现代汉语通用平衡语料库现在重新开放网络查询了。重开后的在线检索速度更快,功能更强,同时提供检索结果下载。现代汉语
lhyxcxy
7年前
5131
面向机器学习的自然语言标注1.2 语料库语言学简史
1.2 语料库语言学简史 20世纪中叶,语言学实际上主要作为一种描述手段,用来研究语言中的结构属性和语言之间的类型差异。这使得构成语言表达的不同信息成分的描写模型相当复杂。在其他社会科学领域中,收集和分析数据一直来自统计学的计量技术。20世纪40年代,语言学家
华章计算机
7年前
4389
语料库————(二)
以下是我国20大知名语料库,书到用时方恨少,还不赶快来收藏?! 1.中央研究院近代汉语标记语料库:http://www.sinica.edu.tw/Early_Mandarin/ 2.中央研究院汉籍电子文献(瀚典全文检索系统)http://www.sinic
lhyxcxy
7年前
3732
gensim训练word2vec语料库初探
NLP技术已经非常成熟,各行各业都需要有专门的NLP技术。网上介绍gensim的材料很多,有几种类型: 翻译,摘录的非原创,采用英文维基wiki语料库的 中文训练,但是采用的现成语料库,比如中文维基,搜狐新闻等通用语料。 真正动起手来,还是困难重重,下面我结
ebxinxi
6年前
2798
NLP 语料分类不均衡的解决办法
一、Introduction 二、Influence 三、别人的解决办法 数据层面: 算法层面: 四、个人的解决办法 五、Reference 一、Introduction 以前在做情感分类问题都是用sst等等,一些经典的语料,但是当自己要做语料的时候,才发现
毛球饲养员
6年前
1750
如何使用中文维基百科语料
前言 在做自然语言处理时很多时候都会需要中文语料库,高质量的中文语料库较难找,维基百科和百度百科算是比较不错的语料库。其中维基百科会定时将语料库打包发布 https://dumps.wikimedia.org/zhwiki/ ,可以下载最新版本的语料库。而百
sea-boat
6年前
2154
GENIA项目-GENIA语料库
GENIA corpus The GENIA corpus is the primary collection of biomedical literature compiled and annotated within the scope of the GE
技术小哥哥
6年前
2017
相关主题
PHP1
deflate
弹球游戏
relax
und
c代码 tif
javaweb struts
Viewpager卡片翻页
Java专业书籍
DBT2
3dsmax
tabbar图片高度
java时间问题
原本
Android开机画面
consoledir()函数
大跃进
c++vector
arraylist对象
现出
watch怎么用
WPF手机充电
style report
java null
rman配置
extjs表格
android渐隐动画
上海居住证
es6中的class
成为
addeventlistener和on
jfreechart折线图
web-root-folder
js拖拽插件
sqlldr
double free
iis 权限
mariadb循环重启
轻松架设Windows
简单的aspnet网站
bigint
java堆空间不足
火狐
sqlserver 1 n
webapp命令maven
tomcat内部异常
jquery_easyui_tab
汇聚
andriod手机
图案输出