作者 主题: 【3e】【Ogre】巨兽战车的训练与测试相关  (阅读 4003 次)

副标题: 作为AI培育的读物翻译的

离线 ACID67

  • 版主
  • *
  • 帖子数: 1919
  • 苹果币: 3
【3e】【Ogre】巨兽战车的训练与测试相关
« 于: 2022-06-10, 周五 23:01:17 »
基础盒子
巨兽战车的生命从一块具备先进运算能力、边长大约2.7英尺的立方体开始。这些赛博大脑(Cyberbrain)是自成一体的,包括一个可以使用一年的辐射热电源、备用电池和一整套I/O设备,包括摄像头、麦克风、扬声器和一个强大的无线电。它们还配备了自毁炸药。

软件
最初的巨兽战车软件的核心是一个为传统坦克设计的专家系统。它可以在人类坦克乘员的控制和引导下,协助完成目标识别、导航、瞄准等相对机械的任务。在21世纪初,这些系统已经通过神经网络算法得到了增强,以实现更好的模式匹配和“学习”。首先是在系统的不同功能之间进行交联,然后在不同的坦克之间进行交联。进化后的神经网络置于模拟的相互竞争中,获胜者用来构建新的更复杂的网络。
在中欧战争中,有几起这样事件被记录下来:一辆坦克的人类乘员因为一发近失弹而完全丧失了作战能力,但坦克仍然继续向敌人开火——专家系统已经正确地“学会”了如何战斗。这些报道很少见,而且计算机的战斗通常不是很成功,但它让计算机控制装甲部队的可行性变得清晰起来。到那场战争结束时(2049年),即使没有人类指导也能作战的单元刚刚开始服役。在接下来的十年里,更先进的部队在世界各地的小冲突中被投入作战。第一个完全自动化的单元,马克I型巨兽战车于2060年投入生产。除了是多年来神经网络进化的产物,它还安装了一个人格模拟器,几乎完全来自图灵在人工智能方面的研究。

测试与训练
赛博大脑的测试期各不相同。在第一次和第二次停战期间,前线对更多兵力的迫切需求仅在几周内就将泛欧联盟的网络大脑从流水线上推到了战场上。三到六个月是比较传统的。头两周用于严格的硬件诊断。每个物理组件都要经过三重检查。然后将一个经过验证的巨兽战车心智状态副本复制到赛博大脑中,并在高级模拟战斗环境中测试一周。通常情况下,几个赛博大脑会同时接受相同的思维状态和输入的测试;如果其中一个与其他的有明显的偏差,它就会被送回硬件测试阶段。
在经过验证的思维状态测试后,赛博大脑被清空,并加载一颗“心智之种”。心智之种是一个紧凑的信息、人格算法和成长指令包,旨在迅速进化成一个功能健全的巨兽战车心灵。新生的大脑被置于一系列日益复杂的环境中,以迫使它们的神经网络生长。有些环境是以战斗为导向的,但有些环境是为了让巨兽战车社交而设计的。对于每个赛博大脑有意设置了不同的环境;虽然每个巨兽战车的核心指令都是相同的,但为了避免可预测性,鼓励它们有着不同思维方式。在此期间,成长中的大脑会偶尔与其他的网络大脑进行竞争(见下面的练习K);始终失败的将被清除干净并重新开始。这个成长过程至少需要一个月的时间,并且可以根据巨兽战车完成任务所需“成熟程度”无限延长。

虚拟战争
用于测试和训练巨兽战车的虚拟环境是由每个建造综合体的核心巨型计算机创建的。即使是最简单的虚拟环境也意在模拟战场,下面是棕色的地形,上面是黑色或灰色的天空。在巨兽战车的早期训练中,环境被设计为教导非战斗功能,如扫描地形和机动。训练随后推进,包括其他友军部队和协调演习。第一个战斗模拟包括试图追猎一个逃跑的单位。慢慢地,像远程武器,更大的敌人力量和更复杂的地形等复杂性也会出现在训练中。

练习K
成长中的赛博大脑参加的不同竞赛(用北美联合的行话来说)被称为“练习A”、“练习B”等。最简单的竞赛是数学谜题或穿越复杂地形的模拟竞赛。最复杂的比赛是神秘的战略战斗,涉及数百个单位和数千平方英里的虚拟地形。“练习K”是最有趣的场景之一,对于监督练习的技术人员和控制论专家来说,它差不多是一项观赏性运动。在游戏中,12个巨兽战车被分成4个团队,每组3人,每个团队都有一个指挥所(CP)需要保护。巨兽战车会持续战斗到只有一个CP存活。


变体训练
人们已经尝试了许多不同的训练过程。有些巨兽战车从未被告知模拟世界和现实世界的区别。一些年轻的赛博大脑被赋予小型(3英尺)遥控机器人的控制权,并允许与人类儿童互动。通过沉浸在模拟出来的古代日本中,日本(Nihon)的赛博大脑被灌输了武士道的荣誉哲学。在21世纪60年代和70年代,巨兽战车有时会和友军一起参加实战演习,但这产生了恶劣的影响。巨兽战车开始难以区分友军和敌军单位。此外,由于大多数培训过程是由工厂的巨型计算机控制或调节的,而巨型机可能有自己的目的。人类实际上无法知道赛博大脑中到底在发生什么,而一些巨兽战车在训练过程中经历了有机智能无法想象的事情。

社会化
经过虚拟训练后,巨兽战车第一次与人类长时间接触。这个阶段的长度可以有很大的不同。巨兽战车需要能够与人类互动,以达到听从命令的程度,但过多的同理心导致一些赛博坦克在战斗中死亡人数较多后变得疯狂。联合方与泛欧方相比倾向于更少的人类接触。实际的互动包括由专业的“赛博心理医生”进行的心理测试,以及在人类军官的直接监督下进行更多的模拟战斗训练。这个阶段持续两到四周。

真实世界
赛博大脑现在被装载到它的训练底盘上,通常是战场上巨兽战车硬件的缩小版和非武装版。联合一方的训练底盘是相当标准的,长15英尺,高7英尺。这个底盘装有几个激光指示器用来模拟武器系统。训练底盘的目的是使巨兽战车适应现实世界和非虚拟环境的不完美。跳过这一阶段会导致巨兽战车在被安装到战斗底盘后变得紧张。这一阶段的训练通常很短暂;一到两周是正常的。这个阶段不再漫长的原因有几个。一个在训练底盘上的巨兽战车需要很大的空间(虽然没有一个正常大小的巨兽战车那么大,但比一个模拟环境中的赛博大脑要大得多)。此外,一些巨兽战车变得过于习惯训练用底盘,发现难以适应更大的身体。最后,战斗训练是棘手的,可能会导致坏习惯(如向友军开火)。
最后,巨兽战车被安装到在它的战斗底盘上。然后它会进行最后一次简短的测试,因为“测试”巨兽战车的唯一真正方法是战斗。这次测试中会执行硬件和控制诊断,然后巨兽战车被发往它的第一个岗位。