原文:Relational Databases and SQL
校验:Kitty Du
# HIDDEN
# Clear previously defined variables
%reset -f
# Set directory for data loading to work properly
import os
os.chdir(os.path.expanduser('~/notebooks/09'))
到目前为止,我们已经处理了作为文本文件存储在计算机上的数据集。虽然使用文本文件存储数据对于分析小数据集很有用,但对许多实际用例来说却是一个挑战。
许多数据集是由多个人收集的,例如,一个数据科学家团队。但是,如果数据存储在文本文件中,那么团队可能需要在每次更新数据时发送和下载新版本的文件。文本文件本身并不能为多个分析员提供一致的数据检索点。这个问题,以及其他问题,使得文本文件难以用于更大的数据集或团队。
我们经常使用关系数据库管理系统(RDBMS)来存储数据,如 MySQL 或 PostgreSQL。为了使用这些系统,我们使用一种称为 SQL 的查询语言,而不是 Python。在本章中,我们将讨论关系数据库模型并介绍 SQL。