数据目录#
当第一次开始进行数据分析时,空白笔记本可能会非常令人望而生畏,特别是如果您从未使用过笔记本或自己创建过笔记本。
Anaconda 提供了样本数据集目录,让您熟悉在笔记本中运行和分析数据集。
访问数据目录#
要打开 Anaconda Notebooks,请单击 Anaconda Cloud 顶部的 **Notebooks**。
Notebooks 打开后,通过单击左上角的蓝色加号 + 打开新的启动器。
在启动器中,在 **Anaconda 数据目录** 下,单击 **探索目录**。

探索目录页面提供预先填充的数据集,让您熟悉在笔记本中进行数据分析。
在 Anaconda Notebooks 中使用数据目录#
如果您不熟悉使用笔记本,请打开 Anaconda Notebooks 上的 README.ipynb,了解 Anaconda Notebooks、在笔记本中工作、创建 conda 环境以及常见问题解答。
有几种方法可以运行数据目录中的单元格。
要运行单个单元格,请单击该单元格将其选中,然后按笔记本顶部的播放按钮。
运行单元格的另一种方法是选择它并按 Shift + Enter(在 Mac 上按回车键)。
单击菜单栏中的 **运行** 并从下拉菜单中选择一个选项,可以找到各种运行单元格的方法。
在本地系统上使用数据目录#
要在本地系统而不是 Anaconda Notebooks 中访问数据目录,请完成以下步骤。
下载 Anaconda(如果您尚未下载)。
注意
如果您使用的是 Miniconda,请在执行以下步骤后运行
pip install anaconda-catalogs[examples]
以安装必要的依赖项。要安装运行 Anaconda 数据目录所需的软件包,请打开终端(Windows 上的 Anaconda Prompt)并运行以下命令。
conda install anaconda-cloud::anaconda-catalogs
通过在 Jupyter Notebook 或其他 Python 环境中运行以下命令(以及后续步骤)来导入 Intake。
import intake
要查看可用的示例目录列表,请运行以下命令。
examples = intake.open_anaconda_catalog("examples") list(examples)
选择一个特定目录并查看它包含哪些数据集。
# Replace <CATALOG> with the catalog name cat = examples.<CATALOG> list(cat)
要从上一步骤中生成的列表中检索特定数据集中的数据,请运行以下命令。
# Replace <DATASET> with the dataset name df = cat.<DATASET>.read()
要在 Pandas Dataframe 中显示目录的前五个条目,请运行以下命令。
df.head()