D-Tale是什么?
Pandas数据框以带有行和列的表格格式表示。它与表格中数据的excel显示非常相似。excel有很多可以操作的界面,比如说数据排序,数据筛选,数据聚合,生成各种图片以及数据透视表等等。Pandas dataframe 和 excel 的显着区别在于,在 Pandas 中,您不能直接对数据集进行修改。您既不能通过任何 GUI 对数据进行排序,也不能通过选择一些参数来创建快速可视化。
Pandas可以定制化地进行数据探索,但是要记住一些基本的语句,比如说怎么导入导出到csv,怎么进行索引等等,这不太友好;还有的时候,你希望进行一些漫无目的的探索,但是又懒得去看帮助文档或者感觉得到的信息针对性不强。你可能会希望有个GUI可视化界面,操作就和Excel一样简单,并且可以把操作过程记录下来,获得数据探索、数据清洗和绘图的代码,下次面对另外的数据也可以重复该过程。
这就是D-Tale!!!D-Tale是一个强大的库,它它与jupyter notebooks和python/ipython终端无缝集成,支持诸如DataFrame,Series,MultiIndex,DateTimeIndex和RangeIndex之类的Pandas对象,可以用很轻量的代码量完成日常所需要的数据分析和可视化工作。
插个楼:Pandas是啥?
Pandas是啥
Pandas 是一个开放源码、BSD 许可的库,提供高性能、易于使用的数据结构和数据分析工具。
Pandas 名字衍生自术语 “panel data”(面板数据)和 “Python data analysis”(Python 数据分析)。
Pandas 一个强大的分析结构化数据的工具集,基础是 Numpy(提供高性能的矩阵运算)。
Pandas 可以从各种文件格式比如 CSV、JSON、SQL、Microsoft Excel 导入数据。
Pandas 可以对各种数据进行运算操作,比如归并、再成形、选择,还有数据清洗和数据加工特征。
Pandas 广泛应用在学术、金融、统计学等各个数据分析领域。