驾驶模型的训练方法和装置、电子设备和介质与流程
本发明涉及人工智能技术,尤其是一种驾驶模型的训练方法和装置、电子设备和介质。
背景技术:
随着科学技术的发展,无人驾驶技术开始慢慢地走进人们的生活。无人驾驶技术是利用车载传感器来感知车辆周围环境,并根据感知所获得的道路、车辆位置和障碍物信息,控制车辆的转向和速度,从而使车辆能够安全、可靠地在道路上行驶。
不过,现有的无人驾驶技术,例如基于多传感器的无人车技术,存在许多潜在问题,而在实际驾驶中慢慢通过路测找出这些问题所需的成本十分高昂。此时,此时,需要一个仿真平台来模拟无人驾驶的整个过程,以便使用较小的成本找出现有无人驾驶技术存在的不足并加以改进。
技术实现要素:
本发明实施例提供一种驾驶模型的训练技术。
根据本发明实施例的一个方面,提供的驾驶模型的训练方法,包括:
生成模拟目标的模拟驾驶环境;
在所述模拟驾驶环境中生成模拟障碍物,所述模拟障碍物包括动态障碍物和/或静态障碍物;
通过所述模拟目标上的传感器采集所述模拟目标的运行状态信息和驾驶环境信息,并将所述运行状态信息和所述驾驶环境信息输入驾驶模型,由所述驾驶模型输出驾驶控制信息,以控制所述模拟目标的行驶;
根据所述模拟目标的行驶是否发生异常,对所述模拟目标的行驶行为进行评测,根据评测结果对所述驾驶模型进行训练。
可选地,在本发明上述各方法实施例中,所述模拟目标包括:车辆,机器人,玩具车。
可选地,在本发明上述各方法实施例中,所述生成模拟目标的模拟驾驶环境,包括:
构建所述模拟目标所在位置的城市交通和道路交通环境,模拟天气和时间,模拟随机目标的位置和行为。
可选地,在本发明上述各方法实施例中,所述构建所述模拟目标所在位置的城市交通和道路交通环境包括:通过城市和道路模型,构建所述模拟目标所在位置的城市交通和道路交通环境;和/或,
所述模拟天气和时间,包括:通过天气模型模拟所述模拟目标所在城市的天气状况,通过时间模型模拟当前时间和光照情况;和/或,
所述模拟随机目标的位置和行为,包括:按照预设配置信息模拟随机目标的位置、行为和运动路线。
可选地,在本发明上述各方法实施例中,所述在所述模拟驾驶环境中生成模拟障碍物,包括:
接收障碍物生成请求,所述障碍物生成请求包括:障碍物类型和数量,生成时间和地理位置;
根据所述障碍物生成请求,调用障碍物模型在所述模拟驾驶环境中生成模拟障碍物。
可选地,在本发明上述各方法实施例中,所述生成模拟目标的模拟驾驶环境之后,还包括:
接收可控目标运行指令,所述可控目标运行指令包括:可控目标的类型和数量,位置和运行路线;
根据所述可控目标运行指令在所述模拟驾驶环境中模拟可控目标及运行行为。
可选地,在本发明上述各方法实施例中,所述可控目标包括以下任意一项或多项:可控行人,可控车辆,可控机器人。
可选地,在本发明上述各方法实施例中,所述可控目标运行指令还包括:可控目标的外观和/或大小。
可选地,在本发明上述各方法实施例中,所述根据所述可控目标运行指令在所述模拟驾驶环境中模拟可控目标及运行行为之后,还包括:
接收所述可控目标上的传感器采集的环境信息;
根据所述可控目标上的传感器采集的环境信息生成对所述可控目标的运行控制信息,以便基于所述运行控制信息控制所述可控目标的运行。
可选地,在本发明上述各方法实施例中,还包括:
通过所述模拟目标上的传感器采集所述模拟目标的所在位置的交通信息并输入所述驾驶模型;
所述驾驶模型基于所述交通信息和所述模拟驾驶环境的地图,确定所述模拟目标的行驶路线;
所述由所述驾驶模型输出驾驶控制信息,包括:所述驾驶模型基于所述运行状态信息、所述驾驶环境信息和所述行驶路线输出驾驶控制信息。
可选地,在本发明上述各方法实施例中,所述模拟目标的行驶是否发生异常,包括以下任意一项或多项:
所述模拟目标在行驶中是否偏离车道、是否撞击到障碍物、是否偏离行驶路线。
根据本发明实施例的另一个方面,提供的驾驶模型的训练装置,包括:
场景生成模块,用于生成模拟目标的模拟驾驶环境;以及调用障碍物模型,在所述模拟驾驶环境中生成模拟障碍物,所述模拟障碍物包括动态障碍物和/或静态障碍物;
控制模块,用于通过所述模拟目标上的传感器采集所述模拟目标的运行状态信息和驾驶环境信息,并将所述运行状态信息和所述驾驶环境信息输入驾驶模型,由所述驾驶模型输出驾驶控制信息,以控制所述模拟目标的行驶;
训练模块,用于根据所述模拟目标的行驶是否发生异常,对所述模拟目标的行驶行为进行评测,根据评测结果对所述驾驶模型进行训练。
可选地,在本发明上述各方法实施例中,所述模拟目标包括:车辆,机器人,玩具车。
可选地,在本发明上述各方法实施例中,所述场景生成模块,具体用于:构建所述模拟目标所在位置的城市交通和道路交通环境,模拟天气和时间,模拟随机目标的位置和行为。
可选地,在本发明上述各方法实施例中,所述场景生成模块,具体用于:调用城市和道路模型,构建所述模拟目标所在位置的城市交通和道路交通环境;调用天气模型,模拟所述模拟目标所在城市的天气状况,通过时间模型模拟当前时间和光照情况;按照预设配置信息模拟随机目标的位置、行为和运动路线;
所述装置还包括:
城市和道路模型,用于构建所述模拟目标所在位置的城市交通和道路交通环境;
天气模型,用于模拟所述模拟目标所在城市的天气状况,通过时间模型模拟当前时间和光照情况。
可选地,在本发明上述各方法实施例中,所述障碍物模型,具体用于:接收障碍物生成请求,所述障碍物生成请求包括:障碍物类型和数量,生成时间和地理位置;根据所述障碍物生成请求,调用障碍物模型在所述模拟驾驶环境中生成模拟障碍物。
可选地,在本发明上述各方法实施例中,所述控制模块,还用于接收可控目标运行指令,所述可控目标运行指令包括:可控目标的类型和数量,位置和运行路线,根据所述可控目标运行指令在所述模拟驾驶环境中模拟可控目标及运行行为。
可选地,在本发明上述各方法实施例中,所述可控目标包括以下任意一项或多项:可控行人,可控车辆,可控机器人。
可选地,在本发明上述各方法实施例中,所述可控目标运行指令还包括:可控目标的外观和/或大小。
可选地,在本发明上述各方法实施例中,还包括:
可控目标生成模块,用于接收所述可控目标上的传感器采集的环境信息;根据所述可控目标上的传感器采集的环境信息生成对所述可控目标的运行控制信息,以便基于所述运行控制信息控制所述可控目标的运行。
可选地,在本发明上述各方法实施例中,所述控制模块,还用于通过所述模拟目标上的传感器采集所述模拟目标的所在位置的交通信息并输入所述驾驶模型,以便所述驾驶模型基于所述交通信息和所述模拟驾驶环境的地图,确定所述模拟目标的行驶路线。
可选地,在本发明上述各方法实施例中,还包括:
驾驶模型,用于基于所述运行状态信息、所述驾驶环境信息和所述行驶路线输出驾驶控制信息。
可选地,在本发明上述各方法实施例中,所述模拟目标的行驶是否发生异常,包括以下任意一项或多项:所述模拟目标在行驶中是否偏离车道、是否撞击到障碍物、是否偏离行驶路线。
根据本发明实施例的又一个方面,提供的一种电子设备,包括:处理器和存储器;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行本发明上述任一实施例所述的驾驶模型的训练方法中各步骤的操作。
根据本发明实施例的又一个方面,提供的一种计算机可读介质,用于存储计算机可读取的指令,所述指令被执行时实现本发明上述任一实施例所述的驾驶模型的训练方法中各步骤的操作。
基于本发明上述实施例提供的驾驶模型的训练方法和装置、电子设备和介质,生成模拟目标的模拟驾驶环境后,可以在模拟驾驶环境中生成模拟障碍物,包括动态障碍物和/或静态障碍物,通过模拟目标上的传感器采集模拟目标的运行状态信息和驾驶环境信息,并将该运行状态信息和驾驶环境信息输入驾驶模型,由驾驶模型输出驾驶控制信息,以控制模拟目标的行驶,根据模拟目标的行驶是否发生异常,对模拟目标的行驶行为进行评测,根据评测结果对驾驶模型进行训练。本发明实施例可以模拟更真实的驾驶环境和模拟目标的实际驾驶行为,根据模拟目标的行驶是否发生异常来对驾驶模型进行训练,使得训练得到的驾驶模型用于自动驾驶技术时,可以更准确地控制目标的行驶行为从而提高自动驾驶的安全性。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
构成说明书的一部分的附图描述了本发明的实施例,并且连同描述一起用于解释本发明的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:
图1为本发明驾驶模型的训练方法一个实施例的流程图。
图2为本发明驾驶模型的训练方法另一个实施例的流程图。
图3为本发明驾驶模型的训练方法又一个实施例的流程图。
图4为本发明驾驶模型的训练方法再一个实施例的流程图。
图5为本发明驾驶模型的训练装置一个实施例的结构示意图。
图6为本发明驾驶模型的训练装置另一个实施例的结构示意图。
图7为本发明电子设备实施例的一个示例性框图。
具体实施方式
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本发明实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
图1为本发明驾驶模型的训练方法一个实施例的流程图。如图1所示,该实施例的驾驶模型的训练方法包括:
102,生成模拟目标的模拟驾驶环境。
在本发明各实施例的一些实施方式中,模拟目标可以是任意可以行使或者移动的对象,例如可以包括但不限于以下任意一项或多项:车辆,机器人,玩具车,等等。本发明不限制模拟目标的具体表现形式。
104,在模拟驾驶环境中生成模拟障碍物,该模拟障碍物包括动态障碍物和/或静态障碍物。
106,通过模拟目标上的传感器采集模拟目标的运行状态信息和驾驶环境信息,并将该运行状态信息和驾驶环境信息输入驾驶模型,由驾驶模型输出驾驶控制信息,以控制模拟目标的行驶。
其中,模拟目标的运行状态信息,例如可以包括但不限于:运动速度、运动加速度、行驶方向等等。模拟目标的驾驶环境信息,例如可以包括但不限于:模拟驾驶环境中的城市道路、障碍物等信息。驾驶控制信息是用于控制模拟目标运行的控制信息,例如可以包括但不限于:控制模拟目标的运动速度、运动加速度、是否变换车道、是否需要打开/关闭灯光等等的信息。
108,根据模拟目标的行驶是否发生异常,对模拟目标的行驶行为进行评测,根据评测结果对所述驾驶模型进行训练,以使得最终训练完成得到的驾驶模型在控制模拟目标的行驶的过程中不会发生异常。
在本发明各实施例的一些实施方式中,模拟目标的行驶是否发生异常,例如可以包括但不限于以下任意一项或多项:模拟目标在行驶中是否偏离车道、是否撞击到障碍物、是否偏离行驶路线等等。若模拟目标发生以上任意一项或多项行为,则认为该模拟目标的行驶即发生异常。本发明不限制模拟目标的行驶是否发生异常的具体类型。
基于本发明上述实施例提供的驾驶模型的训练方法,生成模拟目标的模拟驾驶环境后,可以在模拟驾驶环境中生成模拟障碍物,包括动态障碍物和/或静态障碍物,通过模拟目标上的传感器采集模拟目标的运行状态信息和驾驶环境信息,并将该运行状态信息和驾驶环境信息输入驾驶模型,由驾驶模型输出驾驶控制信息,以控制模拟目标的行驶,根据模拟目标的行驶是否发生异常,对模拟目标的行驶行为进行评测,根据评测结果对驾驶模型进行训练。本发明实施例可以模拟更真实的驾驶环境和模拟目标的实际驾驶行为,根据模拟目标的行驶是否发生异常来对驾驶模型进行训练,使得训练得到的驾驶模型用于自动驾驶技术时,可以更准确地控制目标的行驶行为从而提高自动驾驶的安全性。
在本发明各实施例的一个可选示例中,操作102中,生成模拟目标的模拟驾驶环境,例如可以包括:构建模拟目标所在位置的城市交通和道路交通环境,模拟天气和时间,模拟随机目标的位置和行为。
其中,在一些可选示例中,可以通过城市和道路模型,构建模拟目标所在位置的城市交通和道路交通环境,以模拟城市交通。其中,城市模型可以包括房屋、广告牌、路边装饰等等。道路模型可以包括城市道路和高速道路、交通信号和交通标志等等。例如,道路模型可以模拟每条道路曲率、包括的车道数目、车道线、每个车道的宽度,每个车道上其他车辆的数目、行驶方向以及速度、车道限速,过马路行人的数目、速度,模拟车辆所在车道的车流方向、车道限速,十字路口交通灯的状态,每个交通灯信号的持续时间。
在一些可选示例中,可以通过天气模型模拟所述模拟目标所在城市的天气状况(例如,晴天、阴天、下雨、刮风、下雪),通过时间模型模拟当前时间和光照情况(例如白天上午、白天下午、黑夜)。
在一些可选示例中,模拟随机目标的位置和行为时,可以按照预设配置信息模拟随机目标的位置、行为和运动路线。其中的随机目标为模拟驾驶环境中可随机出现、运动、消失的对象,例如可以包括但不限于:随机行人、随机车辆、随机机器人等等。当随机目标为随机行人时,还可以按照预设配置信息模拟该随机行人的外观(例如衣服颜色、年纪);当随机目标为随机车辆时,还可以按照预设配置信息模拟该随机车辆的外观(例如车辆的形状、颜色,等等)。
基于上述实施例,可以在模拟驾驶环境中生成模拟障碍物,包括动态障碍物和/或静态障碍物,可以构建模拟目标所在位置的城市交通和道路交通环境,模拟天气和时间,模拟随机目标的位置和行为,从而提供一个更贴合实际的模拟驾驶环境,以在各种可能的模拟驾驶环境实现对驾驶模型的训练,使得训练得到的驾驶模型可在各种驾驶环境中正确控制目标对象的行驶。
图2为本发明驾驶模型的训练方法另一个实施例的流程图。如图2所示,在图1所示实施例的基础上,操作104包括:
202,接收障碍物生成请求,该障碍物生成请求包括:障碍物类型和数量,生成时间和地理位置。
其中,障碍物类型可以包括静态障碍物和动态障碍物,静态障碍物例如可以是散落在地的垃圾、树叶、塑料袋、石头等等,动态障碍物例如可以是飘落的垃圾、飞翔的小鸟、跑动的动物、滚动的球体等等。
204,根据上述障碍物生成请求,调用障碍物模型在模拟驾驶环境中生成模拟障碍物。
其中,可以通过远程过程调用(remoteprocedurecall,rpc)通信模式调用外部的障碍物模型,向障碍物模型发送障碍物生成请求,来实现在模拟驾驶环境中生成模拟障碍物。
基于该实施例,可以调用障碍物模型在模拟驾驶环境中生成模拟障碍物,包括静态障碍物和动态障碍物,使得模拟驾驶环境更贴合实际情况,增加模拟驾驶的难度,从而使得训练得到的驾驶模型具有更好的驾驶性能。
图3为本发明驾驶模型的训练方法又一个实施例的流程图。如图3所示,在图1或图2所示实施例的基础上,在操作102之后,还可以包括:
302,接收可控目标运行指令,该可控目标运行指令可以包括:可控目标的类型和数量,位置和运行路线。
在本发明各实施例的一些实施方式中,可控目标为模拟驾驶环境中可以控制其运行的对象,例如可以包括但不限于以下任意一项或多项:可控行人,可控车辆,可控机器人等等。本发明不限制可控目标的具体表现形式。
另外,可选地,在另一些可选示例中,可控目标运行指令还可以包括:可控目标的外观和/或大小。例如,当可控目标为可控行人时,该可控目标运行指令还可以包括可控行人的外观和/或大小(例如衣服颜色、年纪、是否残疾,等等);当可控目标为可控车辆时,该可控目标运行指令还可以包括可控车辆的外观(例如车辆的形状、颜色,等等)。
304,根据上述可控目标运行指令在模拟驾驶环境中模拟可控目标及其运行行为。
另外,可选地,再参见图3,在上述操作304之后,还可以包括:
306,接收可控目标上的传感器采集的环境信息。
本发明实施例中,每个可控目标上可以安装一个或多个传感器,用于实时采集可控目标周围的环境信息;采集到的环境信息可以通过rpc通信模式传给外部程序,以辅助外部程序完成后续可控目标的运行。该外部程序,可以是驾驶模型,也可以是单独形成的可控目标控制模型。
308,根据可控目标上的传感器采集的环境信息生成对可控目标的运行控制信息,以便基于该运行控制信息控制可控目标的运行。
基于该实施例,可以在模拟驾驶环境中模拟各种可能的可控目标(例如车辆、行人等),并可以根据可控目标上的传感器采集的环境信息来控制可控目标的运行,使得模拟驾驶环境更贴合实际情况,增加模拟驾驶的难度,从而使得训练得到的驾驶模型具有更好的驾驶性能。
图4为本发明驾驶模型的训练方法再一个实施例的流程图。如图4所示,该实施例包括:
402,生成模拟目标的模拟驾驶环境。
在本发明各实施例的一个可选示例中,该操作402中,可以构建模拟目标所在位置的城市交通和道路交通环境,模拟天气和时间,模拟随机目标的位置和行为。
404,在模拟驾驶环境中生成模拟障碍物,该模拟障碍物包括动态障碍物和/或静态障碍物。
406,通过模拟目标上的传感器采集模拟目标的运行状态信息和驾驶环境信息,并将该运行状态信息和驾驶环境信息输入驾驶模型,以及通过模拟目标上的传感器采集模拟目标的所在位置的交通信息(例如交通灯情况、道路上其他目标的位置和运行状态、目的地等)并输入驾驶模型。
其中,模拟目标的所在位置的交通信息,例如可以包括但不限于:模拟目标所在车道的下一个交通灯状态、弯道处车道信息、弯道处车辆信息、交通事故,等等。
408,驾驶模型基于上述交通信息和模拟驾驶环境的地图,确定模拟目标的行驶路线。
其中,模拟驾驶环境的地图可以预先生成并存储在驾驶模型中或者驾驶模型可以调用的存储模块中。
410,驾驶模型基于上述运行状态信息、驾驶环境信息和行驶路线输出驾驶控制信息,以控制模拟目标的行驶。
412,根据模拟目标的行驶是否发生异常,对模拟目标的行驶行为进行评测,根据评测结果对驾驶模型进行训练。
基于该实施例,可以生成模拟目标的模拟驾驶环境,通过模拟目标上的传感器采集模拟目标的运行状态信息和驾驶环境信息,并将该运行状态信息和驾驶环境信息输入驾驶模型,以及通过模拟目标上的传感器采集模拟目标的所在位置的交通信息并输入驾驶模型,由驾驶模型确定模拟目标的行驶路线,并基于上述运行状态信息、驾驶环境信息和行驶路线输出驾驶控制信息控制模拟目标的行驶,然后根据模拟目标的行驶是否发生异常来对驾驶模型进行训练,从而使得训练得到的驾驶模型可以选择正确、合理的行驶路线控制目标(例如车辆、机器人等)安全行驶。
图5为本发明驾驶模型的训练装置一个实施例的结构示意图。该实施例的训练装置可用于实现本发明上述各训练方法实施例。如图5所示,该实施例的驾驶模型的训练装置包括:场景生成模块,控制模块和训练模块。其中:
场景生成模块,用于生成模拟目标的模拟驾驶环境,其中的模拟目标例如可以包括:车辆,机器人,玩具车等等;以及调用障碍物模型,在模拟驾驶环境中生成模拟障碍物,该模拟障碍物包括动态障碍物和/或静态障碍物。
控制模块,用于通过所述模拟目标上的传感器采集所述模拟目标的运行状态信息和驾驶环境信息,并将所述运行状态信息和所述驾驶环境信息输入驾驶模型,由所述驾驶模型输出驾驶控制信息,以控制所述模拟目标的行驶;
训练模块,根据所述模拟目标的行驶是否发生异常,对所述模拟目标的行驶行为进行评测,根据评测结果对所述驾驶模型进行训练。
在其中一些实施方式中,模拟目标的行驶是否发生异常,例如可以包括但不限于以下任意一项或多项:模拟目标在行驶中是否偏离车道、是否撞击到障碍物、是否偏离行驶路线等等。
基于本发明上述实施例提供的驾驶模型的训练装置,生成模拟目标的模拟驾驶环境后,可以在模拟驾驶环境中生成模拟障碍物,包括动态障碍物和/或静态障碍物,通过模拟目标上的传感器采集模拟目标的运行状态信息和驾驶环境信息,并将该运行状态信息和驾驶环境信息输入驾驶模型,由驾驶模型输出驾驶控制信息,以控制模拟目标的行驶,根据模拟目标的行驶是否发生异常,对模拟目标的行驶行为进行评测,根据评测结果对驾驶模型进行训练。本发明实施例可以模拟更真实的驾驶环境和模拟目标的实际驾驶行为,根据模拟目标的行驶是否发生异常来对驾驶模型进行训练,使得训练得到的驾驶模型用于自动驾驶技术时,可以更准确地控制目标的行驶行为从而提高自动驾驶的安全性。
在其中一些实施方式中,场景生成模块具体用于构建模拟目标所在位置的城市交通和道路交通环境,模拟天气和时间,模拟随机目标的位置和行为。
例如,在其中一些可选示例中,场景生成模块,具体用于:调用城市和道路模型,构建模拟目标所在位置的城市交通和道路交通环境;调用天气模型,模拟上述模拟目标所在城市的天气状况,通过时间模型模拟当前时间和光照情况;按照预设配置信息模拟随机目标的位置、行为和运动路线。
图6为本发明驾驶模型的训练装置另一个实施例的结构示意图。如图6所示,在图5的基础上,驾驶模型的训练装置还可以包括:城市和道路模型,用于构建模拟目标所在位置的城市交通和道路交通环境;天气模型,用于模拟上述模拟目标所在城市的天气状况,通过时间模型模拟当前时间和光照情况。
在其中一些实施方式中,障碍物模型具体用于:接收障碍物生成请求,障碍物生成请求包括:障碍物类型和数量,生成时间和地理位置;根据障碍物生成请求,调用障碍物模型在模拟驾驶环境中生成模拟障碍物。
在本发明驾驶模型的训练装置的又一个实施例中,控制模块,还可用于接收可控目标运行指令,该可控目标运行指令包括:可控目标的类型和数量,位置和运行路线,另外还可以选择性地包括可控目标的外观和/或大小;根据可控目标运行指令在模拟驾驶环境中模拟可控目标及运行行为。
在其中一些实施方式中,上述可控目标可以包括但不限于以下任意一项或多项:可控行人,可控车辆,可控机器人。
另外,本发明实施例的训练装置还可以包括:可控目标生成模块,用于接收可控目标上的传感器采集的环境信息;根据可控目标上的传感器采集的环境信息生成对可控目标的运行控制信息,以便基于运行控制信息控制可控目标的运行。
在本发明驾驶模型的训练装置的又一个实施例中,控制模块,还可用于通过模拟目标上的传感器采集模拟目标的所在位置的交通信息并输入驾驶模型,以便驾驶模型基于交通信息和模拟驾驶环境的地图,确定模拟目标的行驶路线。
另外,再参见图6,本发明实施例的训练装置还可以包括:驾驶模型,用于基于运行状态信息、驾驶环境信息和行驶路线输出驾驶控制信息。
另外,本发明实施例还提供了一种电子设备,包括:处理器和存储器;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行本发明上述任一实施例所述驾驶模型的训练方法。
图7为本发明电子设备实施例的一个示例性框图。下面,参考图7来描述根据本公开实施例的电子设备。该电子设备可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。如图7所示,电子设备包括一个或多个处理器和存储器。
处理器可以是中央处理单元(cpu)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。处理器可被配置为执行图1-图4中任一驾驶模型的训练方法的处理步骤。
存储器可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(ram)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(rom)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器可以运行所述程序指令,以实现上文所述的本公开的各个实施例的驾驶模型的训练的方法以及/或者其他期望的功能。
在一个示例中,电子设备还可以包括:输入装置和输出装置,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
此外,该输入设备还可以包括例如键盘、鼠标等等。
该输出装置可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出设备可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图7中仅示出了该电子设备中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备还可以包括任何其他适当的组件。
除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本本公开上述各实施例的驾驶模型的训练方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本公开的实施例还可以包括计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本公开说明书上述各实施例的驾驶模型的训练方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。