WEB开发网
开发学院软件开发Python 使用 Python 和 pureXML 操作 CSV 数据 阅读

使用 Python 和 pureXML 操作 CSV 数据

 2010-02-25 00:00:00 来源:WEB开发网   
核心提示:开始之前本教程主要针对希望了解如何以 XML 格式将数据存储在数据库中、从 Python 应用程序连接到 DB2 以及将数据从 CSV 文件转换成 XML 文档的开发人员,学习本教程不要求具备 Python 的知识(您将在本教程中了解如何安装 Python),使用 Python 和 pureXML 操作 CSV 数据,

开始之前

本教程主要针对希望了解如何以 XML 格式将数据存储在数据库中、从 Python 应用程序连接到 DB2 以及将数据从 CSV 文件转换成 XML 文档的开发人员。学习本教程不要求具备 Python 的知识(您将在本教程中了解如何安装 Python),但具有相关知识会有所帮助。本教程假设您使用 Microsoft® Windows® 操作系统,但所用的代码应该可用于其他操作系统。在学习完本教程之后,您将能够创建强大的 Python 应用程序,它可以与 IBM DB2 数据库交互并利用 pureXML 提供的功能。

关于本教程

常用缩略词

API:应用编程接口

CSV:逗号分隔值

DBA:数据库管理员

SQL:结构化查询语言

UI:用户界面

URL:统一资源定位符

XML:可扩展标记语言

IBM DB2 数据库管理系统早就成为关系数据管理方面的主导者。不过,在最近几年对更加灵活和面向文档的数据结构的需求越来越大。这种数据结构的杰出例子就是 XML。

在许多关系数据库系统开始在其数据库中添加某种形式的 XML 支持时,IBM DB2 是唯一允许将 XML 原生地储存在数据库中的产品,不需要对 XML 的初始形式进行任何更改。这种技术称为 pureXML — 它允许 DB2 开发人员和 DBA 以 XML 数据和关系数据的形式操作报告,并且不对 XML 的纯度产生不良影响。

在本教程中中,您将开发一个 Python 脚本,它连接到美国人口普查局的 Web 站点,并下载一个包含关于国家、地区和州级别的人口数据的 CSV 文件 —— 包括 2000 年的人口普查结果,并且在后续的年份中该数据根据估算值浮动。您将学习如何处理该数据,即将它转换成 XML 文档。您并不导入这个大型文档然后使用 DB2 函数将其划分成单个的行,而是使用 Python 将该数据插入到 DB2 中,其中使用一个 XML 文档来储存 CSV 文件中对应的每个相关行。最后,您将创建一个命令行应用程序,它生成一些关于该数据的有用报告,这些报告根据人口从多到少的顺序显示州、地区或国家列表。

1 2 3 4 5 6  下一页

Tags:使用 Python pureXML

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接