敏捷数据科学 - 使用报告


在本章中,我们将学习报告创建,这是敏捷方法论的一个重要模块。敏捷冲刺将通过可视化创建的图表页面转化为成熟的报告。通过报告,图表变得交互式,静态页面变得动态且与网络相关的数据。数据价值Pyramid报告阶段的特征如下所示 -

敏捷冲刺图表页面

我们将更加注重创建csv文件,它可以用作数据科学分析的报告,并得出结论。尽管敏捷侧重于减少文档,但始终会考虑生成报告以提及产品开发的进度。

import csv
#----------------------------------------------------------------------
def csv_writer(data, path):
   """
      Write data to a CSV file path
   """
   with open(path, "wb") as csv_file:
   writer = csv.writer(csv_file, delimiter=',')
   for line in data:
   writer.writerow(line)
#----------------------------------------------------------------------
if __name__ == "__main__":
   data = ["first_name,last_name,city".split(","),
      "Tyrese,Hirthe,Strackeport".split(","),
      "Jules,Dicki,Lake Nickolasville".split(","),
      "Dedric,Medhurst,Stiedemannberg".split(",")
   ]
	
   path = "output.csv"
   csv_writer(data, path)

上面的代码将帮助您生成“csv 文件”,如下所示 -

逗号分隔值

让我们考虑一下 csv(逗号分隔值)报告的以下好处 -

  • 它对人友好且易于手动编辑。
  • 实现和解析都很简单。
  • CSV 可以在所有应用程序中处理。
  • 它更小,处理速度更快。
  • CSV 遵循标准格式。
  • 它为数据科学家提供了简单的模式。