2024年滴滴数据分析面试题
题目:
问题:1.订单的应答率、完单率分别是多少?2.呼叫应答时间多长? 3.从这一周的数据来看,呼叫量最高的是哪一个小时(当地时间)? 呼叫量最少的是哪一个小时(当地时间)?
4.呼叫订单第二天继续呼叫的比例有多少?
5.如果要对表中乘客进行分类,你认为需要参考哪一些因素?
解题过程:导入mysql数据库及数据预处理观察表中时间相关数据结合题目,要做出2步数据预处理【1】将时间相关列转换格式【2】按巴西比中国慢11小时,将表中北京时间转换为巴西时间。
-- 利用cast函数转换成日期数据 update didi set
call_time = cast(call_time as datetime), grab_time = cast(grab_time as datetime),
cancel_time = cast(cancel_time as datetime), finish_time = cast(finish_time as datetime);
-- 将北京时间调整为巴西时间,date_sub函数 update didi set
call_time = date_sub(call_time,interval 11 hour ), grab_time = date_sub(grab_time,interval 11 hour ),
cancel_time = date_sub(cancel_time,interval 11 hour ), finish_time = date_sub(finish_time,interval 11 hour );
处理后数据问题1:订单的应答率、完单率分别是多少?
应答率 = 应答订单数 / 呼叫订单数完单率 = 完成订单数 / 呼叫订单数
select sum(if(year(grab_time)<>1970,1,0))/count(call_time)as '应答率', sum(if(year(finish_time)<>1970,1,0))/count(call_time)as '完单率' from didi 问题2:呼叫应答时间多长? -- 使用timestampdiff函数,计算应答时间与呼叫时间之间的时长 select sum(TIMESTAMPDIFF(MINUTE,call_time,grab_time))/count(grab_time)as '呼叫应答时间' from didi where year(grab_time)<>1970; 问题3: 从这一周的数据来看