深入理解watchdog2-qcom_SA8295实现

上一篇介绍了watchdog实现框架,不同厂家soc提供的实现会有所差异,但是整体流程还是在框架范围内。以项目中具体的实践进一步说明watchdog的功能,许多车企都在使用qcom的SA8295芯片,本文也以此为例。

流程图

深入理解watchdog2-qcom_SA8295实现

SA8295芯片是和qnx系统绑定的,系统层面一般是采用Q+L或Q+A的架构,即host端为QNX,guest端为linux(或android)。watchdog模块在host和guest都有实现,host端虚拟设备vdev驱动充当硬件,guest端需要定期发送心跳信号(pet)重置host端的vdev。

为了对比watchdog通用框架中的实现,需要对qcom 实现中的名词进行解释下:

  • pet:'投食',由guest端发起,同义的有: ping、heartbeat,都是指心跳信号;
  • bark:'狗叫',由host端发起,通用框架中pretimeout回调的功能,收集重启前的信息;
  • bite:'狗咬',由host端发起,通用框架中timeout触发的功能,重启设备;

流程:

  1. guest喂狗进程msm-watchdog定期发送pet信号,重置host端的定时器;
  2. 当guest系统异常导致无法发送pet信号,bark timeout后会发送irq到guest端,guest端msm-watchdog收到中断后收集信息用于问题分析;
  3. 步骤2收集完后等待bite重启guest,图中的vmm为虚拟机管理器,管理guest的启动、停止等生命周期。

guest实现

分为watchdog驱动(qcom_soc_wdt.c)和watchdog core框架(qcom_wdt_core.c)2部分。

深入理解watchdog2-qcom_SA8295实现

黄色:core框架实现;绿色:驱动实现

  1. 入口:watchdog设备第一会执行 qcom_soc_wdt_probe进行初始化;
  2. 每种具体的watchdog型号都会有对应实现的操作集:qcom_soc_wdt_ops
qcom_soc_set_wdt_bark:设置bark timeout时间,宏QCOM_WATCHDOG_BARK_TIME(11s)定义;
qcom_soc_set_wdt_bite:设置bite timeout时间,qcom实现为bark_timeout +3000(14s);
qcom_soc_reset_wdt:重启watchdogqcom_soc_enable_wdt:开启watchdogqcom_soc_disable_wdt:停止watchdogqcom_soc_show_wdt_status:获取watchdog status信息;
  1. 调用框架提供的qcom_wdt_register方法提供了主要的实现。原型如下,其中wdog_dd_name为msm-watchdog,即喂狗线程的名字。
int qcom_wdt_register(struct platform_device *pdev, struct msm_watchdog_data *wdog_dd, char *wdog_dd_name)

qcom_wdt_dt_to_pdata:

深入理解watchdog2-qcom_SA8295实现

赋值watchdog关键字段:

  • bark_irq: bark_time超时后guest会发送irq给guest,值有linux-lv.config定义:
vdev vdev-msm.so loc 0x1c400000 name vdev-msm wdt_base 0x17C10000 wdt_hz 32765 wdt_bark_irq 32 wdt_bite_irq 33 
  • bark_time: 通用框架中的pretimeout,当该时间到期后会收集信息,值是有宏QCOM_WATCHDOG_BARK_TIME定义,默认为11s;
  • pet_time: 喂狗间隔,定期向host发送心跳(heartbeat)信号,值是有宏QCOM_WATCHDOG_PET_TIME定义,默认为9.360s;
  • do_ipi_ping:当msm-watchdog向host发送心跳信号,所在的local cpu同时也会向其他cpu发送ping信号,让其他cpu保持活跃状态,值是有宏QCOM_WATCHDOG_IPI_PING定义,默认为true;
  • wakeup_irq_enable: 系统suspend和resume时,watchdog会自动停止和恢复,值是有宏QCOM_WATCHDOG_WAKEUP_ENABLE定义,默认为true;

msm-watchdog

kthread_create创建喂狗进程,间隔pet_time向host发送心跳信号。实现上和通用watchdog架构类似,逻辑也不复杂。

深入理解watchdog2-qcom_SA8295实现

qcom_wdt_init

深入理解watchdog2-qcom_SA8295实现

该处的实现比较重大,上图对其中的主要步骤进行了列举。

注:部分函数参数进行了简略以便突出关键点。

  1. devm_request_irq

申请bark中断号和中断处理函数 qcom_wdt_bark_handler,中断号为32,触发方式为IRQF_TRIGGER_RISING(上升沿),中断名字为apps_wdog_bark。当bark timeout后guest会收到中断并执行qcom_wdt_bark_handler函数:

[IVI]# cat /proc/interrupts
           CPU0       CPU1       CPU2       CPU3       CPU4       CPU5       CPU6       CPU7
 10:          0          0          0          0          0          0          0          0     GICv3  32 Edge      apps_wdog_bark

qcom_wdt_bark_handler主要用于收集信息,并等待bite 中断重启:

[ 1481.289810] msm_watchdog 17c10000.qcom,wdt: QCOM Apps Watchdog bark! Now = 1481.289807
[ 1481.289812] msm_watchdog 17c10000.qcom,wdt: QCOM Apps Watchdog last pet at 1469.924284
[ 1481.289814] msm_watchdog 17c10000.qcom,wdt: cpu alive mask from last pet 1f
[ 1481.289815] msm_watchdog 17c10000.qcom,wdt: Causing a QCOM Apps Watchdog bite!
[ 1481.290591] msm_watchdog 17c10000.qcom,wdt: Wdog - STS: 0xffffffff, CTL: 0xffffffff, BARK TIME: 0xffffffff, BITE TIME: 0xffffffff
  1. set_bark_time和set_bite_time

设置bark_timeout和bite_tiemout值,值是由前面的qcom_wdt_dt_to_pdata初始化的,下面也说明了bark后预留了一部分时间用于收集信息才会reset系统。这里也是通用框架中pretimeout的实现场景之一。

bite_tiemout = bark_timeout + 3000ms
  1. qcom_wdt_panic_handler

注册panic notifier通知链,即发生panic时会触发链表上的回调函数。该功能比较实用,可以自定义一些行为,如收集内存信息,cpu信息等。该处的回调实现为qcom_wdt_panic_handler:

static int qcom_wdt_panic_handler(struct notifier_block *this, unsigned long event, void *ptr)
  {
    ...
  	if (panic_timeout == 0) {
  		wdog_dd->ops->disable_wdt(wdog_dd);
  	} else {
  		qcom_wdt_reset_on_oops(wdog_dd, panic_timeout);
  	}
  }
static void qcom_wdt_reset_on_oops(struct msm_watchdog_data *wdog_dd, int timeout)
{
	wdog_dd->ops->set_bark_time((timeout + 10) * 1000, wdog_dd);
	wdog_dd->ops->set_bite_time((timeout + 10) * 1000, wdog_dd);
}

如果定义了panic_timeout(如通过宏CONFIG_PANIC_TIMEOUT或者cmdline),即发生panic后等待多久重启。不为0的情况下会在 qcom_wdt_reset_on_oops设置bark和bite timeout时间,触发bark会延迟panic_timeout + 10;

  1. qcom_wdt_pet_task_wakeup

启动喂狗定时器,同通用框架中实现。pet_timer为9.360s,定时器结束后触发qcom_wdt_pet_task_wakeup

//1. 设置定时器函数
timer_setup(&wdog_dd->pet_timer, qcom_wdt_pet_task_wakeup, 0);
// 2.定时器到期后唤醒msm-watchdog
static void qcom_wdt_pet_task_wakeup(struct timer_list *t)
{
...
	wake_up(&wdog_dd->pet_complete);
}
// 3. 执行 qcom_wdt_kthread
static __ref int qcom_wdt_kthread(void *arg)
  {
    ...
  	while (!kthread_should_stop()) {
  		do {
  			ret = wait_event_interruptible(wdog_dd->pet_complete,
  						wdog_dd->timer_expired);
  		} while (ret != 0);

结束

这篇主要介绍了sa8295 watchdog guest端实现,主要流程应该大致清楚了,可以对比通用框架和qcom实现的一样点和差异点。host端涉及也较多,放在下一篇介绍。

© 版权声明
THE END
如果内容对您有所帮助,就支持一下吧!
点赞0 分享
冬冬的专属空间的头像 - 鹿快
评论 抢沙发

请登录后发表评论

    暂无评论内容