敏捷数据科学 - 使用报告
在本章中,我们将学习报告创建,这是敏捷方法论的一个重要模块。敏捷冲刺将通过可视化创建的图表页面转化为成熟的报告。通过报告,图表变得交互式,静态页面变得动态且与网络相关的数据。数据价值Pyramid报告阶段的特征如下所示 -
我们将更加注重创建csv文件,它可以用作数据科学分析的报告,并得出结论。尽管敏捷侧重于减少文档,但始终会考虑生成报告以提及产品开发的进度。
import csv
#----------------------------------------------------------------------
def csv_writer(data, path):
"""
Write data to a CSV file path
"""
with open(path, "wb") as csv_file:
writer = csv.writer(csv_file, delimiter=',')
for line in data:
writer.writerow(line)
#----------------------------------------------------------------------
if __name__ == "__main__":
data = ["first_name,last_name,city".split(","),
"Tyrese,Hirthe,Strackeport".split(","),
"Jules,Dicki,Lake Nickolasville".split(","),
"Dedric,Medhurst,Stiedemannberg".split(",")
]
path = "output.csv"
csv_writer(data, path)
上面的代码将帮助您生成“csv 文件”,如下所示 -
让我们考虑一下 csv(逗号分隔值)报告的以下好处 -
- 它对人友好且易于手动编辑。
- 实现和解析都很简单。
- CSV 可以在所有应用程序中处理。
- 它更小,处理速度更快。
- CSV 遵循标准格式。
- 它为数据科学家提供了简单的模式。