ag百家乐九游会 Python数据分析实战: 以数据分析岗为例, 探索行业与薪资干系性
发布日期:2024-10-17 10:56    点击次数:82

金三银四,数据分析师成为繁多行业竞相追赶的热点岗亭,思知说念如安在这个范畴精确发力、脱颖而出吗?今天,我将以 BOSS 直聘上的数据为样本,借助 Python 强大的数据分析智商,深度理会各个行业与薪资干系性分析,底下沿路学习!

1.数据准备

最初,咱们需要导入必要的库并加载数据。

import pandas as pdimport numpy as npfrom pyecharts import options as optsfrom pyecharts.charts import Bar, Pie, Boxplot, WordCloud, Mapfrom pyecharts.globals import SymbolTypeimport re# 加载数据df = pd.read_excel('/home/mw/project/BOSS直聘数据分析师职位.xlsx')# 稽察数据概览df.head(3)

# 稽察数据信息df.info

2. 数据清洗

咱们需要对数据进行清洗,格外是薪资边界和陶冶条款字段。

def process_salary(salary): if not isinstance(salary, str): return np.nan # 贬责日薪 if '元/天' in salary: # 提真金不怕火第一个数值(-前边的数值) daily = float(re.findall(r'(\d+\.?\d*)', salary.split('-')[0])[0]) return daily * 30 / 1000 # 诊疗为月薪(千元),百家乐AG真人按30天揣度 # 贬责时薪 elif '元/时' in salary: # 提真金不怕火第一个数值(-前边的数值) hourly = float(re.findall(r'(\d+\.?\d*)', salary.split('-')[0])[0]) return hourly * 8 * 30 / 1000 # 诊疗为月薪(千元),8小时/天,30天/月 # 贬责月薪 elif 'K' in salary or 'k' in salary: # 提真金不怕火第一个数值(-前边的数值) monthly = float(re.findall(r'(\d+\.?\d*)', salary.split('-')[0])[0]) # 贬责16薪等情况 if '薪' in salary: months = float(re.findall(r'(\d+)薪', salary)[0]) return monthly * months / 12 return monthly # 贬责纯数字月薪(如10000-15000) elif re.search(r'\d+-\d+', salary): # 提真金不怕火第一个数值(-前边的数值) monthly = float(re.findall(r'(\d+\.?\d*)', salary.split('-')[0])[0]) return monthly / 1000 # 诊疗为千元 # 其他情况(如纯数字) else: try: return float(re.findall(r'(\d+\.?\d*)', salary)[0]) / 1000 # 诊疗为千元 except: return np.nan# 专揽贬责函数df['薪资月薪(K)'] = df['薪资边界'].apply(process_salary)# 走漏前3行成果df.head(3)

3.行业与薪资干系性分析

分析不同业业的数据分析师岗亭薪资是否存在权贵各别。

# 按公司类型分组统计薪资industry_salary = df.groupby('公司类型')['薪资月薪(K)'].agg(['mean', 'median', 'count']).sort_values('mean', ascending=False)# 筛选至少有5个样本的行业industry_salary = industry_salary[industry_salary['count'] >= 5]# 可视化bar1 = ( Bar .add_xaxis(industry_salary.index.tolist) .add_yaxis("薪资月薪(K)", industry_salary['mean'].round(1).tolist) .set_global_opts( title_opts=opts.TitleOpts(title="不同业业数据分析师平均薪资"), yaxis_opts=opts.AxisOpts(name="薪资(千元)"), xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=45)), ))bar1.render_notebook

由柱形图不错看出游戏、互联网、电子商务行业的平均月薪资最高,折柳达到约21.5k、20.4k和16.6k,传统行业如医疗健康、告白公关会展的薪资相对较低,差未几在11K掌握,互联网干系行业(游戏、互联网、电子商务)大批高于其他行业ag百家乐九游会,在责任遴荐时不错更倾向于互联网公司的数据分析岗。





Powered by 百家乐AG真人 @2013-2022 RSS地图 HTML地图