Skip to content

SamPetux/StackoverflowJobes

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Stack Overflow Salary Analysis Project

Описание проекта

Этот код предназначен для анализа данных о зарплатах разработчиков из Stack Overflow за период с 2011 по 2024 год (с возможностью подгрузки будущих годов). Основные задачи проекта включают:

  • Обработку сырых данных из CSV-файлов
  • Нормализацию названий профессий и стран
  • Корректировку зарплат с учетом инфляции
  • Создание единой базы данных для последующего анализа

Структура проекта

Файлы:

  • IT_аналитика.ipynb - Jupyter Notebook с кодом обработки данных
  • ProfessionsDict.json - словарь для нормализации названий профессий
  • it_professions_db.sql - SQL-скрипт для создания структуры базы данных PostgreSQL

Использованные технологии

  • Python 3
  • Pandas для работы с данными
  • CSV для чтения/записи файлов
  • Регулярные выражения для обработки текста
  • PostgreSQL для хранения нормализованных данных

Особенности реализации

  1. Нормализация профессий:
    • Создан словарь для унификации названий профессий за разные годы
    • Учтены изменения в классификациях Stack Overflow
  2. Обработка зарплат:
    • Корректировка на инфляцию с приведением к 2024 году
    • Удаление некорректных значений
  3. Работа со странами:
    • Унификация названий стран
    • Выявление общего списка стран за весь период
  4. База данных:
    • Нормализованная структура с таблицами стран, профессий и языков программирования
    • Связь респондентов с их навыками и демографическими данными

Как использовать

  1. Клонируйте репозиторий
  2. Для работы с базой данных:
    • Установите PostgreSQL
    • Выполните скрипт it_professions_db.sql для создания структуры БД
    • Импортируйте данные из CSV-файлов с помощью команд COPY
  3. Для работы с Jupyter Notebook:
    • Убедитесь, что все CSV-файлы с данными находятся в папке /content/
    • Запустите IT_аналитика.ipynb
    • Результаты будут сохранены в ProfsDF.csv

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors