通识教育

阿姆斯特朗数

如果一个 n 位正整数等于其各位数字的 n 次方之和，则称该数为阿姆斯特朗数。
中国宗教在线用户关键词及用户关系

【数据名称】 1. Keywords List； 2. Religion Network。【数据说明】Keywords List是中国宗教用户关键词列表，Religion Network是宗教用户构成的社交网络。【使用说明】
中文诗歌数据集

这是最全的中华古典文集数据库，包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。诗人包括唐宋两朝近 1.4 万古诗人，和两宋时期 1.5 千古词人。数据来源于互联网。
中文阅读理解数据集

这是首个中文阅读理解数据集，包括人民日报和儿童童话(PD&CFT)。
清华大学开放中文词库THUOCL

THUOCL（THU Open Chinese Lexicon）是由清华大学自然语言处理与社会人文计算实验室整理推出的一套高质量的中文词库，词表来自主流网站的社会标签、搜索热词、输入法词库等。
中文文本分类数据集THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成，包含74万篇新闻文档（2.19 GB），均为UTF-8纯文本格式。我们在原始新浪新闻分类体系的基础上，重新整合划分出14个候选分类类别：财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。使用THUCTC工具包在此数据集上进行评测，准确率可以达到88.6%。
NLPIR自然语言处理与信息检索共享平台

NLPIR实验室定位为世界一流的多语种认知智能创新中心，服务于国家安全治理、行业大数据挖掘与个人智能服务。
StackExchange

Open Data Stack Exchange是是一个面向对开放数据感兴趣的开发人员和研究人员的问答网站。
SuperDataScience

SuperDataScience是关于数据科学和人工智能的图书馆，包含56门课程。
ChemDB Chemoinformatics Portal

加州大学尔湾分校化学信息学数据集
WOLFRAM

WOLFRAM DATA REPOSITORY是一个公共资源，它承载着一个不断扩展的可计算数据集集合，经过策划和结构化，适合立即用于计算、可视化、分析等。
Bigml

Bigml提供适合机器学习的公共数据源。
OPEN DATA NETWORK

OPEN DATA NETWORK发布并共享数据，查找并构建数据以及回答问题。
Data Is Plural — Structured Archive

Data Is Plural — Structured Archive电子表格跟踪了每周通讯《Data Is Plural》上发布的项目。
Python 拓扑排序

对一个有向无环图(Directed Acyclic Graph简称DAG)G进行拓扑排序，是将G中所有顶点排成一个线性序列，使得图中任意一对顶点u和v，若边(u,v)∈E(G)，则u在线性序列中出现在v之前。通常，这样的线性序列称为满足拓扑次序(Topological Order)的序列，简称拓扑序列。简单的说，由某个集合上的一个偏序得到该集合上的一个全序，这个操作称之为拓扑排序。
希尔排序

希尔排序，也称递减增量排序算法，是插入排序的一种更高效的改进版本。但希尔排序是非稳定排序算法。
计数排序

计数排序的核心在于将输入的数据值转化为键存储在额外开辟的数组空间中。作为一种线性时间复杂度的排序，计数排序要求输入的数据必须是有确定范围的整数。
堆排序

堆排序（Heapsort）是指利用堆这种数据结构所设计的一种排序算法。堆积是一个近似完全二叉树的结构，并同时满足堆积的性质：即子结点的键值或索引总是小于（或者大于）它的父节点。堆排序可以说是一种利用堆的概念来排序的选择排序。
Python 归并排序

归并排序（英语：Merge sort，或mergesort），是创建在归并操作上的一种有效的排序算法。该算法是采用分治法（Divide and Conquer）的一个非常典型的应用。
Python 冒泡排序

冒泡排序（Bubble Sort）也是一种简单直观的排序算法。它重复地走访过要排序的数列，一次比较两个元素，如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换，也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢"浮"到数列的顶端。

首页

尾页

栏目简介

旨在通过专业设计、体系化梳理的内容帮助高校学生快速了解、系统掌握数据科学相关知识，尽可能学生降低认知门槛、提高学习效率。

阿姆斯特朗数

中国宗教在线用户关键词及用户关系

中文诗歌数据集

中文阅读理解数据集

清华大学开放中文词库THUOCL

中文文本分类数据集THUCNews

NLPIR自然语言处理与信息检索共享平台

StackExchange

SuperDataScience

ChemDB Chemoinformatics Portal

WOLFRAM

Bigml

OPEN DATA NETWORK

Data Is Plural — Structured Archive

Python 拓扑排序

希尔排序

计数排序

堆排序

Python 归并排序

Python 冒泡排序

栏目简介

热点推荐

猜你喜欢