当前位置:网站首页>Yahoo! Answers-数据集
Yahoo! Answers-数据集
2022-08-03 12:29:00 【51CTO】
来自雅虎 Yahoo! Answers Comprehensive Questions and Answers1.0 数据集的 10 个主要分类数据。每个类 别分别包含 140,000 个训练样本和 5,000 个测试样本。
This article offers an empirical exploration on the use of character-level convolutional networks (ConvNets) for text classification. We constructed several large-scale datasets to show that character-level convolutional networks could achieve state-of-the-art or competitive results. Comparisons are offered against traditional models such as bag of words, n-grams and their TFIDF variants, and deep learning models such as word-based ConvNets and recurrent neural networks.
译:
本文对字符级卷积网络(ConvNets)在文本分类中的应用进行了实证研究。我们构建了几个大规模的数据集,以证明字符级卷积网络可以达到最先进或最具竞争力的结果。比较了传统模型,如单词包、n-grams及其TFIDF变体,以及基于单词的ConvNets和递归神经网络等深度学习模型。
大家可以到官网地址下载数据集,我自己也在百度网盘分享了一份。可关注本人公众号,回复“2020082503”获取下载链接。
只要自己有时间,都尽量写写文章,与大家交流分享。
本人公众号:

边栏推荐
- R语言拟合ARIMA模型并使用拟合模型进行预测推理、使用autoplot函数可视化ARIMA模型预测结果、可视化包含置信区间的预测结果
- 安全自定义 Web 应用程序登录
- 第4章 搭建网络库&Room缓存框架
- 新评论接口——京东评论接口
- Autumn recruitment work
- setTimeout, setInterval requestAnimationFrame
- R语言ggplot2可视化:使用ggpubr包的ggsummarystats函数可视化箱图(通过ggfunc参数设置)、在可视化图像的下方添加描述性统计结果表格
- pytorch+tensorboard使用方法
- SQL分页查询_Sql根据某个字段分页
- 链游NFT元宇宙游戏系统开发技术方案及源码
猜你喜欢
随机推荐
Filebeat 如何保持文件状态?
一次内存泄露排查小结
TiKV & TiFlash 加速复杂业务查询丨TiFlash 应用实践
博客记录生活
随机森林项目实战---气温预测
实数取整写入文件(C语言文件篇)
2022 年 CISO 最关心的是什么?
从器件物理级提升到电路级
技术分享 | 接口自动化测试如何搞定 json 响应断言?
Random forest project combat - temperature prediction
-找树根-
常用lambda表达式
苹果发布 AI 生成模型 GAUDI,文字生成 3D 场景
如图,想批量读取mysql,批量处理,有哪个地方参数需要改变呢?
(through page) ali time to upload the jar
第十五章 源代码文件 REST API 简介
通过点击CheckBox实现背景变换小案例
【Verilog】HDLBits题解——Verification: Writing Testbenches
特征工程学习笔记
-找树根2-








