机器学习 – 如何在OpenAI中创建一个新的健身房环境?

                我有一个任务,要制作一个AI代理,学习使用ML玩视频游戏.我想使用OpenAI Gym创建一个新环境,因为我不想使用现有环境.如何创建新的自定义环境?

                另外,有没有其他方法可以让我开始让AI Agent在没有OpenAI Gym的帮助下玩特定的视频游戏?

                在极小的环境中查看我的 banana-gym.

                创建新环境

                请参阅存储库的主页面:

                https://github.com/openai/gym/blob/master/docs/creating-environments.md

                步骤是:

                >使用PIP包结构创建新的存储库

                它看起来应该是这样的

                gym-foo/
                  README.md
                  setup.py
                  gym_foo/
                    __init__.py
                    envs/
                      __init__.py
                      foo_env.py
                      foo_extrahard_env.py

                有关其内容,请点击上面的链接.那里没有提到的细节特别是foo_env.py中的某些函数应该是什么样子.查看示例并在gym.openai.com/docs/有所帮助.这是一个例子:

                class FooEnv(gym.Env):
                    metadata = {'render.modes': ['human']}
                
                    def __init__(self):
                        pass
                
                    def _step(self, action):
                        """
                
                        Parameters
                        ----------
                        action :
                
                        Returns
                        -------
                        ob, reward, episode_over, info : tuple
                            ob (object) :
                                an environment-specific object representing your observation of
                                the environment.
                            reward (float) :
                                amount of reward achieved by the previous action. The scale
                                varies between environments, but the goal is always to increase
                                your total reward.
                            episode_over (bool) :
                                whether it's time to reset the environment again. Most (but not
                                all) tasks are divided up into well-defined episodes, and done
                                being True indicates the episode has terminated. (For example,
                                perhaps the pole tipped too far, or you lost your last life.)
                            info (dict) :
                                 diagnostic information useful for debugging. It can sometimes
                                 be useful for learning (for example, it might contain the raw
                                 probabilities behind the environment's last state change).
                                 However, official evaluations of your agent are not allowed to
                                 use this for learning.
                        """
                        self._take_action(action)
                        self.status = self.env.step()
                        reward = self._get_reward()
                        ob = self.env.getState()
                        episode_over = self.status != hfo_py.IN_GAME
                        return ob, reward, episode_over, {}
                
                    def _reset(self):
                        pass
                
                    def _render(self, mode='human', close=False):
                        pass
                
                    def _take_action(self, action):
                        pass
                
                    def _get_reward(self):
                        """ Reward is given for XY. """
                        if self.status == FOOBAR:
                            return 1
                        elif self.status == ABC:
                            return self.somestate ** 2
                        else:
                            return 0

                使用您的环境

                import gym
                import gym_foo
                env = gym.make('MyEnv-v0')

                例子

                > https://github.com/openai/gym-soccer
                > https://github.com/openai/gym-wikinav
                > https://github.com/alibaba/gym-starcraft
                > https://github.com/endgameinc/gym-malware
                > https://github.com/hackthemarket/gym-trading
                > https://github.com/tambetm/gym-minecraft
                > https://github.com/ppaquette/gym-doom
                > https://github.com/ppaquette/gym-super-mario
                > https://github.com/tuzzer/gym-maze

                相关文章
                相关标签/搜索
                香港王中王论坛资枓香港正香四肖八码期期准精选资料app,四肖八码期期准精选资料最新官方版app预约 镇远县| 滕州市| 大埔县| 边坝县| 卢氏县| 永修县| 左贡县| 延边| 阳新县| 陵水| 万年县| 齐河县| 三原县| 凉城县| 手游| 蒲城县| 松滋市| 台江县| 潢川县| 和平县| 佛教| 井陉县| 九龙城区| 林芝县| 阜南县| 安图县| 明水县| 宁武县| 梁平县| 兰坪| 藁城市| 冷水江市| 山东| 斗六市| 新巴尔虎左旗| 盘山县| 招远市| 贵德县| 广安市| 六枝特区| 体育| 西昌市| 湖北省| 环江| 阳朔县| 彩票| 蕉岭县| 阿图什市| 平度市| 昌邑市| 林口县| 华池县| 南木林县| 察隅县| 双鸭山市| 延津县| 商南县| 晋宁县| 泸水县| 高州市| 固原市| 精河县| 元谋县| 胶南市| 忻州市| 璧山县| 铁岭县| 蒲江县| 涞源县| 保靖县| 和林格尔县| 麻栗坡县| 循化| 新河县| 光山县| 曲阜市| 资讯| 江永县| 普陀区| 石泉县| 青冈县| 上高县| 县级市| 开封市| 昭苏县| 安国市| 舒城县| 宁津县| 闻喜县| 通化市| 塘沽区| 会同县| 五台县| 湘乡市| 巴楚县| 滨州市| 钟山县| 阿坝县| 肃宁县| 滨海县| 公安县| 普兰店市| 盘锦市| 长子县| 湛江市| 阜宁县| 华池县| 揭阳市| 新蔡县| 台北县| 新绛县| 赤城县| 高阳县| 河东区| 榕江县| 贵阳市| 平南县| 开平市| 天镇县| 信丰县| 玉溪市| 桐庐县| 元谋县| 视频| 通城县| 富源县| 玉屏| 齐齐哈尔市| 建始县| 孝昌县| 延安市| 崇义县| 洞头县| 库尔勒市| 遵义县| 化德县| 新蔡县| 华宁县| 娱乐| 开化县| 集安市| 宁安市| 日照市| 大安市| 邯郸市| 韶关市| 翼城县| 黄冈市| 弥渡县| 屏东县| 五家渠市| 呼和浩特市| 平舆县| 乳山市| 郓城县| 广平县| 通江县| 溧阳市| 岚皋县| 金溪县| 闽侯县| 韶关市| 土默特左旗| 柳林县| 淮滨县| 外汇| 光山县| 平阳县| 曲阜市| 会理县| 南丰县| 永昌县| 合川市| 敖汉旗| 德格县| 洮南市| 股票| 大荔县| 辽阳市| 颍上县| 水城县| 开远市| 大厂| 亳州市| 密山市| 博湖县| 恩施市| 普陀区| 桂阳县| 丰原市| 望都县| 怀宁县| 赫章县| 根河市| 凌海市| 长乐市| 鄂尔多斯市| 绥滨县| 宜兰县| 九江县| 景东| 邯郸县| 昌宁县| 开原市| 安仁县| 海安县| 天全县| 灵台县| 房山区| 岐山县| 云南省| 湟源县| 石棉县| 江都市| 杂多县| 百色市| 海淀区| 郑州市| 锡林郭勒盟| 介休市| 隆安县| 西和县| 固安县| 苍山县| 伊川县| 淮滨县| 东乡县| 康平县| 汉中市| 崇仁县| 乌审旗| 陕西省| 滁州市| 盐亭县| 阆中市| 广河县| 嘉定区| 田东县| 城步| 武城县| 镇江市| 汉沽区| 大邑县| 股票| 同江市| 沙河市| 南城县| 陕西省| 贵南县| 仙游县| 仁怀市| 渭南市| 镇坪县| 自治县| 福泉市| 铅山县| 兴仁县| 黑龙江省| 界首市| 海林市| 布拖县| 黑龙江省| 平泉县| 麻城市| 临洮县| 江川县| 庄浪县| 南溪县| 长葛市| 新郑市| 泰州市| 突泉县| 罗平县| 云和县| 波密县| 台州市| 繁峙县| 章丘市| 顺昌县| 西平县| 兴业县| 彭山县| 郧西县| 奉化市| 布尔津县| 页游| 呼和浩特市| 济南市| 鄂托克前旗| 宣武区| 屏南县| 曲靖市| 崇信县| 金昌市| 正蓝旗| 诸暨市| 漠河县| 绥中县| 左云县| 本溪| 苏尼特右旗| 昌邑市| 宁化县| 日喀则市| 渑池县| 广西| 高台县| 临猗县| 安阳市| 南江县| 札达县| 青河县| 马龙县| 博爱县| 安达市| 兰坪| 获嘉县| 拜泉县| 札达县| 莆田市| 万年县| 织金县| 苗栗县| 庆元县| 茌平县| 五河县| 杭州市| 巴塘县| 眉山市| 黔江区| 溆浦县| 星子县| 桐庐县| 延川县| 光山县| 汽车| 苗栗县| 宜兰市| 全椒县| 五河县| 麻阳| 无锡市| 达拉特旗| 顺昌县| 深州市| 中山市| 静安区| 云林县| 南城县| 三台县| 沛县| 旅游| 仁布县| 承德县| 镇江市| 丹阳市| 南开区| 湟源县| 望奎县| 泰兴市| 昌平区| 西安市| 黄石市| 聂拉木县| 博客| 晋中市| 铅山县| 湘阴县| 永兴县| 神农架林区| 阳城县| 延津县| 郓城县| 溧水县| 葫芦岛市| 南城县| 栾城县| 思南县| 交口县| 潜江市| 疏附县| 武义县| 商城县| 长武县| 岢岚县| 鸡西市| 高邮市| 双鸭山市| 桦南县| 霸州市| 天镇县| 杂多县| 吉安市| 阜康市| 永泰县| 建始县| 千阳县| 仙居县| 祁东县| 措勤县| 裕民县| 竹北市| 克拉玛依市| 四平市| 北川| 隆回县| 宝应县| 乌苏市| 监利县| 西青区| 渭源县| 阜阳市| 蕲春县| 玉溪市| 且末县| 和田市| 恭城| 商丘市| 南城县| 连南| 新巴尔虎左旗| 洞口县| 南靖县| 襄垣县| 都安| 射阳县| 剑川县| 晋城| 台北市| 焉耆| 罗定市| 察雅县| 富源县| 常德市| 桂平市| 灌南县| 寿阳县| 富蕴县| 三门峡市| 荆州市| 阳泉市| 越西县| 五大连池市| 青神县| 深泽县| 天津市| 饶河县| 河南省| 灌阳县| 新余市| 丽水市| 石台县| 耿马| 桓台县| 敖汉旗| 英山县| 徐水县| 平乐县| 保德县| 鹤岗市| 诏安县| 上饶县| 确山县| 延津县| 定陶县| 莫力| 襄樊市| 平潭县| 巴彦淖尔市| 阳曲县| 平南县| 射阳县| 荃湾区| 明溪县| 延安市| 亳州市| 安徽省| 九江市| 天峨县| 原阳县| 东安县| 阿拉善盟| 封开县| 保康县| 吕梁市| 布尔津县| 绥芬河市| 九寨沟县| 大渡口区| 潢川县| 沈阳市| 新乡市| 修文县| 彭阳县| 清水县| 错那县| 淮阳县| 遂昌县| 广宗县| 凤翔县| 襄城县| 同心县| 淮安市| 区。| 寻甸| 龙井市| 平泉县| 安阳市| 长白| 南川市| 汽车| 广安市| 新田县| 昌乐县| 宁都县| 堆龙德庆县| 清远市| 英超| 平罗县| 保德县| 成武县| 东丽区| 新余市| 阜阳市| 海阳市| 龙游县| 襄垣县| 昭觉县| 项城市| 大渡口区| 长白| 延吉市| 疏附县| 东源县| 铁岭市| 若尔盖县| 永兴县| 泽普县| 出国| 延长县| 宝鸡市| 博客| 措勤县| 洞口县| 胶州市| 舟山市| 龙井市| 商城县| 垣曲县| 元谋县| 凤翔县| 肇州县| 郸城县| 剑川县| 黄陵县| 贡山| 雷波县| 瓮安县| 吴川市| 黎川县| 兴和县| 平山县| 融水| 沭阳县| 广平县| 来安县| 合山市| 英吉沙县| 凤凰县| 隆昌县| 勐海县| 元朗区| 板桥市| 临洮县| 怀来县| 台东县| 永登县| 兴业县| 灯塔市| 苍溪县| 长治县| 陆河县| 凤山市| 肇源县| 宾阳县| 邢台县| 铁岭市| 宁安市| 呼和浩特市| 吉水县| 康保县| 怀远县| 安泽县| 泸水县| 高密市| 嘉善县| 武定县| 扬中市| 大荔县| 乐清市| 华容县| 和田县| 环江| 祁连县| 谢通门县| 从化市| 东明县| 沁阳市| 全州县| 抚顺县| 香格里拉县| 田林县| 如皋市| 晋宁县| 吉林省| http://m.jx1870browsev.fun http://m.jx1870downloadv.fun http://3g.jx1870blowv.fun http://3g.jx1870aizv.fun http://wap.jx1870causev.fun http://jx1870applyv.fun http://m.jx1870downloadv.fun http://m.jx1870borderv.fun http://www.jx1870couplev.fun http://m.jx1870cutv.fun http://m.jx1870buildv.fun http://3g.jx1870creazv.fun http://jx1870affiliatev.fun http://wap.jx1870chipv.fun http://wap.jx1870doubtv.fun http://3g.jx1870addv.fun http://m.jx1870conductv.fun http://www.jx1870dancev.fun