字段搜索
共有 287 个数据目录
开放方式:
-
涵盖网络问答对数据,包括知识问答、常识问答、娱乐新闻问答等主题,培养模型对问题的深刻理解和准确回答的能力
数据堂(北京)科技股份有限公司提供主题领域:2023-11-15更新
-
医疗影像是通过医疗系统内成像设备(ct、核磁等)拍摄,形成患者dicom格式影像数据,同时医生出具报告,形成“诊断报告 影像”交付患者,用于患者保存、异地会诊、院内科室会诊等。
数据堂(北京)科技股份有限公司提供主题领域:2023-11-15更新
-
有关美食的摄影图像数据,包含高清图片、说明、标签等
数据堂(北京)科技股份有限公司提供主题领域:2023-11-15更新
-
包括国家部委、地方政府等的政策文件、政策研究报告、政策解读文章和政策问答数据
数据堂(北京)科技股份有限公司提供主题领域:2023-11-15更新
-
根据核苷酸和蛋白质序列获取到相似序列,以及相关专利、期刊文献和生物公共库中的公开信息;可帮助研发和ip人员进行序列创新信息检索,了解项目是否有侵权风险,并可以快速获取当前市场的战略布局,监控市场动态
数据堂(北京)科技股份有限公司提供主题领域:2023-11-05更新
-
面向对话大模型的高质量、多类型指令数据集,包括但不限于单轮对话、多轮对话、个性化指令、上下文理解指令和推理思维链等
数据堂(北京)科技股份有限公司提供主题领域:2023-09-14更新
-
该数据集包含全国各地区政策、新闻、财税类知识、问答等信息
数据堂(北京)科技股份有限公司提供主题领域:2023-09-14更新
-
文本内容涵盖80多个学科领域,进行了准确的标签分类和严格的内容清洗。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新
-
该数据集是一个上千万轮的双人对话的高质量工程化数据集,覆盖金融、教育、客服等行业和场景,用于大模型的训练和调优。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新
-
真实场景对话采集,高度还原真实场景的模拟对话。兼顾分布的代表性、多样性和样本规模。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新
-
来自世界10多个国家的20万小时音频文本,主要包含中、英、维、藏等国内重点安防关注领域;
数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新
-
来自世界主要国家2200余个官方信源、经过翻译审校的全球科技前沿信息。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新
-
面向全球企业、产业链、创新技术、防务目标的高质量知识数据,涵盖多语种对齐,实体数量高达5亿,三元组数量近100亿
数据堂(北京)科技股份有限公司提供主题领域:2023-09-12更新
-
4000w句智能座舱场景高质量人机交互数据,涵盖座舱场景内各种交互形式。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-04更新
-
包含中医学领域知识信息,包括中医疾病诊断方法、治疗方案、中医药品、方剂、中医操作、古籍文献等内容。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-04更新
-
涵盖956场真实会议场景,多人多轮次对话音频数据集,可应用于语音对话与听觉大模型的研究。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新
-
"全国信息化、数字化建设项目公开信息数据。同时,对文本进行了清洗,形成了结构化字段。 字段:包括建设单位、项目名称、预算、供应商、建设内容等"
数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新
-
主流电商商品信息数据
数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新
-
全国、省、市、区县宏观经济数据、产业发展指标数据、产业链指标数据
数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新
-
涵盖17种方言口语,自然表达的音频数据集,可应用于语音对话与听觉大模型的研究。
数据堂(北京)科技股份有限公司提供主题领域:2023-09-03更新