做拼货商城网站深圳百度公司地址在哪里

张小明 2026/1/9 15:06:42
做拼货商城网站,深圳百度公司地址在哪里,文具用品网站设计规划书,nodejs可以做企业网站吗原文#xff1a;towardsdatascience.com/i-built-an-ai-human-level-game-player-31b78df8aca3 一段时间以前#xff0c;我为一个游戏构建了人类级自动玩家的决策部分。 这个棋盘游戏自动玩家的实力非常强大#xff0c;以至于我所知道的任何人#xff08;包括我自己#…原文towardsdatascience.com/i-built-an-ai-human-level-game-player-31b78df8aca3一段时间以前我为一个游戏构建了人类级自动玩家的决策部分。这个棋盘游戏自动玩家的实力非常强大以至于我所知道的任何人包括我自己都无法持续击败它以至于我不得不以可控的方式让它变得更简单以便让休闲玩家感到有趣。在这篇文章中我解释了我是如何使用深度学习之前的 AI 标准技术来编程这个小游戏的“大脑”的。你将学习如果你还不熟悉的话如何构建 Minimax 树以及如何为棋盘评估开发启发式方法。Minimax 技术可以应用于任何对抗性游戏而不管我所描述的游戏的具体细节如何。进入 Kromate当移动设备开始变得流行大约在 2008 年iPhone 发布之后可用的棋盘游戏很少。而且有些游戏在当时的小屏幕上根本无法玩。当然这包括象棋你无法在 3.5 英寸的屏幕上以 320 x 480 像素的分辨率真正显示棋盘。你可以但会累坏你的眼睛。我的兄弟之一提出了一个想法即一个非常小的棋盘游戏位置少于 20 个而不是象棋中的 64 个只放置 6 种颜色的“棋子”而不是象棋中的 16 个。他想出了类似于象棋的规则包括“将军”和“将死”。这个游戏被称为“Kromate”因为它使用颜色来识别棋子。我恐怕不得不详细解释如何玩 Kromate因为否则你将无法理解自动玩家是如何解决这个问题的。考虑图中这个棋盘https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/917d4a22d39cc8c4b2b441f05286f8cc.pngKromate 应用 iPhone 截图已编辑棋盘上有 19 个位置用于放置 6 种颜色的棋子。两位玩家每人有 3 个棋子一位玩家拥有“基本”颜色红色、蓝色、黄色另一位玩家拥有“次级”颜色橙色、绿色、紫色。次级颜色是通过混合两种基本颜色形成的这或许让你想起了你小学时的岁月。棋盘上有 19 个位置而不是 20 个比如这可能看起来有些奇怪但如果你看看图中的位置排列它就像一个蜂巢有行和斜线路径。看看上面的棋盘。这个棋盘可以在小屏幕上正确显示你不这么认为吗即使是原始的 iPhone 也能展示出它的全部魅力。初始时棋子随机放置在棋盘上。这也是 Kromate 作为实体棋盘游戏不实用的一个原因例如你需要“扔”棋子然后看看它们最近的空位——这根本不实用。但图片中的红色箭头是什么意思呢嗯那是 Kromate 的类似棋盘的部分当原色代币与次级颜色代币“对齐”时它们可以“攻击”对方反之亦然。例如在上面的图中黄色和蓝色代币正在“攻击”绿色代币因为它们与它对齐黄色与蓝色相加得到绿色。攻击一个次级颜色的代币需要两个原色代币而使用两个次级颜色代币另一名玩家可以攻击一个原色例如紫色和橙色代币可以攻击红色代币因为紫色和橙色都包含红色。代币可以在直线上移动无论是水平还是对角线只要它们不遇到阻挡道路的代币。然而有一个条件是代币落下的地方没有被攻击如上所述。例如在图中绿色代币必须移动因为它被攻击处于“将军”状态。它可以移动到上左方和上右方的一个或两个位置。显然它也可以水平向右移动但这是不允许的因为蓝色和黄色代币也攻击那个地方。现在你们可以玩 Kromate 了。等等但游戏何时结束这就是“将死”的定义。考虑以下位置https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/c9956c9a8f28475c4e691156d6cd1a45.pngKromate iPhone 应用的截图已编辑次级颜色处于“将死”状态因为绿色代币被攻击但它不能移动到任何未被攻击的地方。拥有原色代币的玩家获胜。Kromate iPhone 应用为 Kromate 构建完整的应用对我来说一个人来说有点太多我是一名全职的人工智能研究员所以我联系了一家专门从事 iPhone 开发的公司。那是一家非常独特的公司我在奥斯汀找到了一些俄罗斯开发者。他们看起来很正规并且已经在 Apple Store 上发布了许多应用。我们通过电话协商的安排是我会编写决策部分决定下一步棋他们会做其他所有事情包括用户界面和与操作系统相关的一切比如启动应用、给它一个图标等等。我们从未在现实生活中见过面就签订了合同。这种安排意味着我只需编写一个接受 Kromate 位置以我们同意的方式编码的程序并返回下一步棋。最小-最大技术我遵循了一种名为“最小-最大树”的技术这种技术是由一位名叫亚瑟·萨缪尔的人工智能先驱很久以前发明的。萨缪尔是 IBM 的员工他遵循了约翰·冯·诺伊曼提出的一些想法。他为跳棋游戏开发了一个非常好的自动玩家并引入了“启发式棋盘评估”函数的概念。让我们检查一下这个。启发式棋盘评估函数为每个有效的棋盘位置提供一个实数表示该位置的好坏数值越高越好。一个问题是没有通用的方法来定义棋盘评估函数你必须根据对所玩游戏的知识发挥创意。例如在棋类游戏中该函数会给拥有棋子的情况加分但并非每个棋子的价值相同例如车比象更有价值等等。启发式这个词是经验法则的简称但听起来要好得多。简单来说对于一个启发式棋盘评估函数你需要找到一种方法为好的棋局位置赋予高价值为不好的棋局位置赋予低价值。然后Samuel 使用游戏树来组织对不同替代方案的搜索。首先你必须考虑你可以做出的合法移动。每个移动都会从根处产生一个分支。但对于这些分支中的每一个另一方可以做出一系列的移动除非是将死位置这些也将是分支。这个分支过程可以继续直到满足停止条件。可能存在不同的停止条件最简单的一种是考虑固定数量的树层级即玩家的回合数。这是我为 Kromate 选择的自动玩家AI 的回合另一方的回合然后 AI 再次回合只有两个回合。虽然游戏树将不同的可能性组织在一个地方但我们还需要用它来为顶层做出移动选择。最后要考虑的是如何从根节点获得最佳移动。这就是 Minimax 过程发挥作用的地方。让我们假设图中的游戏树https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/e862edc37269552d6a1a4790e06de0d4.png图片由作者提供初始时在根节点我的位置是 P1我说“我的位置”是从 AI 玩家的角度出发我有两个可能的移动导致 P2 和 P3然后轮到另一方。从位置 P2 开始另一方可以选择一个移动导致位置 P4 或 P5依此类推。树的底部有一些尚未展开的叶子节点。我们必须使用上面提到的启发式函数评估这些棋盘位置。下面我们有了相同的图形但加入了启发式函数的评估https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/01e25cc3678e6ea5ec3bad48c1eb0438.png图片由作者提供现在是 Minimax 有趣的部分从底部向上传播评估。我们首先从某个位置下的评估中取最大值因为轮到我下棋https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/16b2b89ae491d9e6cbdf4f7b006a0512.png图片由作者提供继续向上假设另一方是理性的它将选择给我最差评估的选项是的另一方希望我不好如下所示https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/8eb98ad8ac64869968f08c032eff7fcd.png图片由作者提供虽然我们可以将评估传播到顶部树的根但在这里它们不是必需的除了查看最佳获胜概率。现在我们可以选择最佳移动即从 P1 到 P2。简而言之Minimax 技术就像“前瞻”几步这是优秀的棋手经常做的事情。Minimax 玩家不仅评估从你的第一步产生的结果这意味着静态评估 P1 和 P3并从中选择最佳选项而是探索接下来会发生什么——在一定程度上——然后只选择导致最佳静态评估的移动。不要认为 Minimax 就是关于树搜索的全部。在过程中提出了许多改进例如alpha-beta 剪枝用于从搜索树中剪掉整个分支。Kromate 上的 Minimax当 IBM 的 DeepBlue 在 1997 年 5 月的著名象棋比赛中击败卡斯帕罗夫时计算机在移动之前检查了数百万个选项。但这并不是蛮力因为它包括了如 alpha-beta 剪枝等技术来减少搜索树。在另一端Kromate 在搜索树的叶子处检查了不到 100 个位置。Kromate 的 Minimax 树只包含 AI 玩家的两个回合和人类玩家的一个回合正如上面的图示所示。Kromate 的搜索树看起来像是一种激进的简化但出人意料地有效。使用可能的移动数量来评估位置的想法直接击中了要害。这很有道理因为如果你有几个选择你更接近“将死”位置——那里你有一个确切的选择。你拥有的选择越多你离失败就越远。初始时我考虑将许多因素结合起来评估位置这是一种常见的做法。然而当我正在细化每个因素的细节时我意识到几乎所有其他因素都比可能的移动数量要少得多。在这个阶段读者您可以看到设计一个静态评估函数并不容易。这可能是一个复杂的过程而且无法保证结果会很好。这就是为什么只有当我看到 AI 玩家的出色表现时我才意识到静态评估函数是好的。人类水平的 AI我将整个 Kromate AI 玩家编程为一个 Objective C 函数该函数返回一个 Kromate 移动作为一对两个数字要移动的标记和目的地位置。坦白说当我仅基于古老的 Minimax 树完成了自动玩家时我并没有期望它会有超过基本性能的表现。但是我和它玩了几场比赛在我看来AI 玩家似乎很强。当然我对 AI Kromate 玩家的主观印象可能会受到它是我创造的这个事实的影响我可能会有“宠物效应”使我的测试变得不那么严格。但我把游戏给每个人测试时他们都无法击败它——在某些情况下根本无法击败其他人可以赢几次但大多数比赛都输了。说实话我没有资源对 AI Kromate 玩家与人类进行比较的系统评估但我可以告诉你大多数人发现它太难击败以至于他们不再觉得游戏体验有趣。你不想连续输 10 次AI 玩家如此强大以至于我不得不“简化”它使游戏更具吸引力。例如我可以通过减少 Minimax 树的深度来简化 Kromate AI 玩家但我不想对代码进行重大修改并希望提供几个级别——包括最难级别——所以我提出了一个更简单的解决方案。“基准”Kromate 玩家随机选择一个有效的走法。实际上我在 AI 玩家之前就编写了这个程序。不用说基准玩家很容易被人类玩家击败。因此我将 AI 玩家的走法与随机玩家的走法“混合”在一起。通过修改每个单独走法的随机或 AI 选择的概率很容易调整每种走法的比例。我最终提供了 5 个不同的级别包括底部的随机基准和顶部的 AI 玩家以及 3 个中间级别选择 AI 玩家的概率分别为 0.25、0.5 和 0.75。那接下来发生了什么非常少。我的俄罗斯同事在 2009 年底在苹果应用商店发布了 Kromate但效果不佳。似乎很少有人愿意从头开始学习一种新的类似国际象棋的游戏即使包括在线帮助。然后他们将 Kromate 包装在游戏捆绑包中另一个捆绑包后来完全放弃了它。在我要求严格的大学全职工作中我没有进一步追求 Kromate 冒险。但我学到了一些东西。一方面直到你亲手处理代码的细节你才完全理解你在说什么。在这种情况下Minimax 方法必须被转换成一系列 Objective C 函数调用从为每个位置中的每个标记生成可能的合法走法开始。另一个教训是最关键的部分是定义一个好的静态位置评估函数这在任何教科书中都没有出现。最后的学习是直到你把它放在实际游戏中测试你才知道你的聪明位置评估函数是否真的有用。实际上。我希望您觉得我进入构建人类水平 AI 玩家的谦逊之旅很有趣。也许这可以激励您在现在有了更强大的工具之后构建其他东西—通过我的免费通讯录“The Skeptic AI Enthusiast”获取我亲自挑选的 AI 新闻分析和科技解释由一位 AI 老兵以批判性的视角审视当前的技术格局请访问rafebrena.substack.com/
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

精美手机网站模板现在网络推广方式

HuggingFace Dataset流式加载:PyTorch-CUDA-v2.6内存优化 在训练大模型时,你是否曾因加载一个几十GB的文本数据集而导致显存爆掉?或者在服务器上配置 PyTorch CUDA 环境时,被版本冲突、驱动不兼容等问题折磨得彻夜难眠&#xff1…

张小明 2026/1/7 16:12:22 网站建设

公司为什么建立网站域名网站建设方案

在数据驱动的时代,问卷调研已成为产品迭代、学术研究、市场洞察不可或缺的工具。然而,许多设计师、产品经理、科研人员甚至HR,都曾陷入过这样的困境:面对空白文档,不知从何问起;精心设计的问题,…

张小明 2026/1/5 23:38:28 网站建设

做网站需要学那些网站开发完整教程

HeyGem与HuggingFace镜像结合使用技巧:加速模型加载方案 在AI数字人视频生成领域,一个看似简单的“口型同步”任务背后,往往隐藏着复杂的模型调度和网络依赖。当用户上传一段音频、选择人物视频后,系统需要调用多个预训练模型完成…

张小明 2026/1/5 23:37:56 网站建设

手机app应用网站文山网站建设

Kotaemon Webhook机制实现事件驱动式响应 在企业级智能对话系统日益复杂的今天,一个工单的创建、一次用户状态变更、一条设备告警信息——这些看似微小的事件,往往决定了客户体验的关键时刻。传统的“用户提问 → 系统回复”模式,在面对这类实…

张小明 2026/1/7 6:29:03 网站建设

兰州一刀切防疫曝光seo是什么意思新手怎么做seo

某金融企业如何用AI数字人实现高效员工培训 在一家全国性商业银行的合规培训部门,每年最头疼的事莫过于组织一次覆盖28个分行、上千名员工的统一政策宣讲。过去,他们需要协调各地拍摄场地、安排出镜人员、反复审核脚本表达是否准确——整个流程动辄耗时两…

张小明 2026/1/5 23:36:20 网站建设

网站建设客户需求调查问卷做卡贴质量好的网站

深入探索 Postfix:从基础到高级配置的全面指南 1. 作者简介 Ralf Hildebrandt 和 Patrick Koetter 是 Postfix 社区中活跃且知名的人物。Hildebrandt 是德国信息和通信技术解决方案公司 T - Systems 的技术经理,而 Koetter 是一位信息架构师,经营着自己的公司,为欧洲和非…

张小明 2026/1/5 23:35:48 网站建设