Как найти среднее по числовому диапазону столбца в датафрейме python
Есть следующий датафрейм, где в колонке Q29
- задан числовой диапазон, например, 10,000 - 15,000
.
Нужно добавить колонку со средним значением от этих цифр.
Предполагаю, что надо разбить сплитом а дальше что, не получается корректно сделать. Помогите!
Q23 Q29
4 Data Scientist 25,000-29,999
17 Data Scientist 200,000-249,999
18 Data Scientist 150,000-199,999
30 Data Scientist 50,000-59,999
33 Machine Learnin 125,000-149,999
... ... ...
23932 Data Scientist 1,000-1,999
23935 Data Scientist 30,000-39,999
23964 Data Scientist 1,000-1,999
23983 Machine Learnin 25,000-29,999
23990 Data Scientist 2,000-2,999
попробовала получить уникальные значения, получила массив:
array(['25,000-29,999', '200,000-249,999', '150,000-199,999',
'50,000-59,999', '125,000-149,999', '5,000-7,499', '10,000-14,999',
'30,000-39,999', nan, '$0-999', '4,000-4,999', '3,000-3,999',
'80,000-89,999', '7,500-9,999', '100,000-124,999', '1,000-1,999',
'15,000-19,999', '90,000-99,999', '40,000-49,999', '60,000-69,999',
'>$1,000,000', '70,000-79,999', '2,000-2,999', '20,000-24,999',
'300,000-499,999', '250,000-299,999', '$500,000-999,999'],
dtype=object)
перевести в флоат так же не получается. Подскажите, логику действий, пожалуйста.