- 人工智能与 Python 教程
- 家
- AI 与 Python – 入门概念
- AI 与 Python – 入门
- AI 与 Python – 机器学习
- AI与Python——数据准备
- 监督学习:分类
- 监督学习:回归
- AI与Python——逻辑编程
- 无监督学习:聚类
- 自然语言处理
- AI 与 Python – NLTK 包
- 分析时间序列数据
- AI与Python——语音识别
- AI 与 Python – 启发式搜索
- AI 与 Python – 游戏
- 使用 Python 进行人工智能 – 神经网络
- 强化学习
- AI与Python——遗传算法
- 人工智能与Python——计算机视觉
- AI 与 Python – 深度学习
- 人工智能与 Python 资源
- AI 与 Python – 快速指南
- AI 与 Python – 有用的资源
- AI 与 Python – 讨论
AI与Python——遗传算法
本章详细讨论人工智能的遗传算法。
什么是遗传算法?
遗传算法 (GA) 是基于自然选择和遗传学概念的基于搜索的算法。遗传算法是一个更大的计算分支(称为进化计算)的子集。
GA 是由 John Holland 和他在密歇根大学的学生和同事开发的,其中最著名的是 David E. Goldberg。此后,它在各种优化问题上进行了尝试,并取得了高度成功。
在 GA 中,我们对给定问题有一系列可能的解决方案。然后这些解决方案经历重组和突变(就像在自然遗传学中一样),产生新的孩子,并且这个过程在各个世代中重复。每个个体(或候选解决方案)都被分配一个适合度值(基于其目标函数值),并且更适合的个体有更高的机会交配并产生更适合的个体。这符合达尔文的适者生存理论。
因此,它会不断地进化出更好的个体或解决方案,直到达到停止标准。
遗传算法本质上是足够随机的,但它们的性能比随机局部搜索(我们只是尝试随机解决方案,跟踪迄今为止最好的解决方案)要好得多,因为它们也利用了历史信息。
如何利用遗传算法解决优化问题?
优化是使设计、情境、资源和系统尽可能有效的行动。以下框图显示了优化过程 -
GA机制优化过程的阶段
以下是 GA 机制用于问题优化时的一系列步骤。
步骤 1 - 随机生成初始种群。
步骤 2 - 选择具有最佳适应度值的初始解决方案。
步骤 3 - 使用变异和交叉算子重新组合选定的解决方案。
步骤 4 - 将后代插入种群中。
步骤 5 - 现在,如果满足停止条件,则返回具有最佳适应值的解决方案。否则转至步骤 2。
安装必要的软件包
为了在 Python 中使用遗传算法解决问题,我们将使用一个强大的 GA 包DEAP。它是一个新颖的进化计算框架库,用于快速原型设计和想法测试。我们可以在命令提示符下使用以下命令来安装此软件包 -
pip install deap
如果您使用的是anaconda环境,则可以使用以下命令安装 deap -
conda install -c conda-forge deap
使用遗传算法实施解决方案
本节向您介绍如何使用遗传算法实施解决方案。
生成位模式
以下示例向您展示如何根据One Max问题生成包含 15 个 1 的位串。
导入必要的包,如图所示 -
import random from deap import base, creator, tools
定义评价函数。这是创建遗传算法的第一步。
def eval_func(individual): target_sum = 15 return len(individual) - abs(sum(individual) - target_sum),
现在,使用正确的参数创建工具箱 -
def create_toolbox(num_bits): creator.create("FitnessMax", base.Fitness, weights=(1.0,)) creator.create("Individual", list, fitness=creator.FitnessMax)
初始化工具箱
toolbox = base.Toolbox() toolbox.register("attr_bool", random.randint, 0, 1) toolbox.register("individual", tools.initRepeat, creator.Individual, toolbox.attr_bool, num_bits) toolbox.register("population", tools.initRepeat, list, toolbox.individual)
注册评估运算符 -
toolbox.register("evaluate", eval_func)
现在,注册交叉运算符 -
toolbox.register("mate", tools.cxTwoPoint)
注册一个变异算子 -
toolbox.register("mutate", tools.mutFlipBit, indpb = 0.05)
定义育种运算符 -
toolbox.register("select", tools.selTournament, tournsize = 3) return toolbox if __name__ == "__main__": num_bits = 45 toolbox = create_toolbox(num_bits) random.seed(7) population = toolbox.population(n = 500) probab_crossing, probab_mutating = 0.5, 0.2 num_generations = 10 print('\nEvolution process starts')
评估整个人口 -
fitnesses = list(map(toolbox.evaluate, population)) for ind, fit in zip(population, fitnesses): ind.fitness.values = fit print('\nEvaluated', len(population), 'individuals')
创建并迭代一代 -
for g in range(num_generations): print("\n- Generation", g)
选择下一代个体 -
offspring = toolbox.select(population, len(population))
现在,克隆选定的个体 -
offspring = list(map(toolbox.clone, offspring))
对后代应用交叉和突变 -
for child1, child2 in zip(offspring[::2], offspring[1::2]): if random.random() < probab_crossing: toolbox.mate(child1, child2)
删除child的适应度值
del child1.fitness.values del child2.fitness.values
现在,应用突变 -
for mutant in offspring: if random.random() < probab_mutating: toolbox.mutate(mutant) del mutant.fitness.values
评估适应度无效的个体 -
invalid_ind = [ind for ind in offspring if not ind.fitness.valid] fitnesses = map(toolbox.evaluate, invalid_ind) for ind, fit in zip(invalid_ind, fitnesses): ind.fitness.values = fit print('Evaluated', len(invalid_ind), 'individuals')
现在,用下一代个体替换人口 -
population[:] = offspring
打印当前世代的统计数据 -
fits = [ind.fitness.values[0] for ind in population] length = len(population) mean = sum(fits) / length sum2 = sum(x*x for x in fits) std = abs(sum2 / length - mean**2)**0.5 print('Min =', min(fits), ', Max =', max(fits)) print('Average =', round(mean, 2), ', Standard deviation =', round(std, 2)) print("\n- Evolution ends")
打印最终输出 -
best_ind = tools.selBest(population, 1)[0] print('\nBest individual:\n', best_ind) print('\nNumber of ones:', sum(best_ind)) Following would be the output: Evolution process starts Evaluated 500 individuals - Generation 0 Evaluated 295 individuals Min = 32.0 , Max = 45.0 Average = 40.29 , Standard deviation = 2.61 - Generation 1 Evaluated 292 individuals Min = 34.0 , Max = 45.0 Average = 42.35 , Standard deviation = 1.91 - Generation 2 Evaluated 277 individuals Min = 37.0 , Max = 45.0 Average = 43.39 , Standard deviation = 1.46 … … … … - Generation 9 Evaluated 299 individuals Min = 40.0 , Max = 45.0 Average = 44.12 , Standard deviation = 1.11 - Evolution ends Best individual: [0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1] Number of ones: 15
符号回归问题
这是遗传编程中最著名的问题之一。所有符号回归问题都使用任意数据分布,并尝试用符号公式拟合最准确的数据。通常,像 RMSE(均方根误差)这样的衡量标准用于衡量个人的健康状况。这是一个经典的回归问题,这里我们使用方程5x 3 -6x 2 +8x=1。我们需要遵循上面示例中的所有步骤,但主要部分是创建原始集,因为它们是个体的构建块,因此可以开始评估。在这里,我们将使用经典的原语集。
以下 Python 代码详细解释了这一点 -
import operator import math import random import numpy as np from deap import algorithms, base, creator, tools, gp def division_operator(numerator, denominator): if denominator == 0: return 1 return numerator / denominator def eval_func(individual, points): func = toolbox.compile(expr=individual) return math.fsum(mse) / len(points), def create_toolbox(): pset = gp.PrimitiveSet("MAIN", 1) pset.addPrimitive(operator.add, 2) pset.addPrimitive(operator.sub, 2) pset.addPrimitive(operator.mul, 2) pset.addPrimitive(division_operator, 2) pset.addPrimitive(operator.neg, 1) pset.addPrimitive(math.cos, 1) pset.addPrimitive(math.sin, 1) pset.addEphemeralConstant("rand101", lambda: random.randint(-1,1)) pset.renameArguments(ARG0 = 'x') creator.create("FitnessMin", base.Fitness, weights = (-1.0,)) creator.create("Individual",gp.PrimitiveTree,fitness=creator.FitnessMin) toolbox = base.Toolbox() toolbox.register("expr", gp.genHalfAndHalf, pset=pset, min_=1, max_=2) toolbox.expr) toolbox.register("population",tools.initRepeat,list, toolbox.individual) toolbox.register("compile", gp.compile, pset = pset) toolbox.register("evaluate", eval_func, points = [x/10. for x in range(-10,10)]) toolbox.register("select", tools.selTournament, tournsize = 3) toolbox.register("mate", gp.cxOnePoint) toolbox.register("expr_mut", gp.genFull, min_=0, max_=2) toolbox.register("mutate", gp.mutUniform, expr = toolbox.expr_mut, pset = pset) toolbox.decorate("mate", gp.staticLimit(key = operator.attrgetter("height"), max_value = 17)) toolbox.decorate("mutate", gp.staticLimit(key = operator.attrgetter("height"), max_value = 17)) return toolbox if __name__ == "__main__": random.seed(7) toolbox = create_toolbox() population = toolbox.population(n = 450) hall_of_fame = tools.HallOfFame(1) stats_fit = tools.Statistics(lambda x: x.fitness.values) stats_size = tools.Statistics(len) mstats = tools.MultiStatistics(fitness=stats_fit, size = stats_size) mstats.register("avg", np.mean) mstats.register("std", np.std) mstats.register("min", np.min) mstats.register("max", np.max) probab_crossover = 0.4 probab_mutate = 0.2 number_gen = 10 population, log = algorithms.eaSimple(population, toolbox, probab_crossover, probab_mutate, number_gen, stats = mstats, halloffame = hall_of_fame, verbose = True)
请注意,所有基本步骤与生成位模式时使用的相同。该程序将在 10 代后为我们提供输出 min、max、std(标准差)。