使用 Python 和 pureXML 操作 CSV 数据
2010-02-25 00:00:00 来源:WEB开发网开始之前
本教程主要针对希望了解如何以 XML 格式将数据存储在数据库中、从 Python 应用程序连接到 DB2 以及将数据从 CSV 文件转换成 XML 文档的开发人员。学习本教程不要求具备 Python 的知识(您将在本教程中了解如何安装 Python),但具有相关知识会有所帮助。本教程假设您使用 Microsoft® Windows® 操作系统,但所用的代码应该可用于其他操作系统。在学习完本教程之后,您将能够创建强大的 Python 应用程序,它可以与 IBM DB2 数据库交互并利用 pureXML 提供的功能。
关于本教程
常用缩略词
API:应用编程接口
CSV:逗号分隔值
DBA:数据库管理员
SQL:结构化查询语言
UI:用户界面
URL:统一资源定位符
XML:可扩展标记语言
IBM DB2 数据库管理系统早就成为关系数据管理方面的主导者。不过,在最近几年对更加灵活和面向文档的数据结构的需求越来越大。这种数据结构的杰出例子就是 XML。
在许多关系数据库系统开始在其数据库中添加某种形式的 XML 支持时,IBM DB2 是唯一允许将 XML 原生地储存在数据库中的产品,不需要对 XML 的初始形式进行任何更改。这种技术称为 pureXML — 它允许 DB2 开发人员和 DBA 以 XML 数据和关系数据的形式操作报告,并且不对 XML 的纯度产生不良影响。
在本教程中中,您将开发一个 Python 脚本,它连接到美国人口普查局的 Web 站点,并下载一个包含关于国家、地区和州级别的人口数据的 CSV 文件 —— 包括 2000 年的人口普查结果,并且在后续的年份中该数据根据估算值浮动。您将学习如何处理该数据,即将它转换成 XML 文档。您并不导入这个大型文档然后使用 DB2 函数将其划分成单个的行,而是使用 Python 将该数据插入到 DB2 中,其中使用一个 XML 文档来储存 CSV 文件中对应的每个相关行。最后,您将创建一个命令行应用程序,它生成一些关于该数据的有用报告,这些报告根据人口从多到少的顺序显示州、地区或国家列表。
- ››使用脚本恢复WinXP系统的用户登录密码
- ››使用phpMyadmin创建数据库及独立数据库帐号
- ››使用Zend Framework框架中的Zend_Mail模块发送邮件...
- ››使用cout标准输出如何控制小数点后位数
- ››使用nofollow标签做SEO的技巧
- ››使用 WebSphere Message Broker 的 WebSphere Tra...
- ››使用SQL Server事件探查器做应用程序的性能分析
- ››使用SQL Server事件探查器分析死锁原因
- ››使用纯文本文件打造WCF服务
- ››使用 Dojo 开发定制 Business Space 小部件,第 4...
- ››使用 ADDRESS 与 INDIRECT函数查询信息
- ››使用 COLUMN函数编制单元信息
更多精彩
赞助商链接