Sodros duomenų analizė¶
Darbo tikslas ir hipotezės¶
Darbo tikslas - išanalizuoti vidutinį darbo užmokesčio bei apdraustųjų skaičiaus kaitą 2018 - 2024 metais. Panagrinėti kaip pasiskirsčiusios įmonės Lietuvoje pagal dydį ir veiklas.
Hipotezės:
- Vidutiniai darbo užmokesčiai didmiesčiuose yra didesni, lyginant su mažesnėmis savivaldybėmis;
- Informacinių technologijų sektoriuje vidutiniai atyginimai didesni nei kituose sektoriuose;
- Daugiausiai stambių imonių yra gamybos sektoriuje;
- Stambios įmonės moka didesnį vidutinį darbo užmokestį nei mažesnės įmonės.
Duomenys¶
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
sodra2024 = pd.read_csv('monthly-2024.csv', sep=';')
sodra2023 = pd.read_csv('monthly-2023.csv', sep=';')
sodra2022 = pd.read_csv('monthly-2022.csv', sep=';')
sodra2021 = pd.read_csv('monthly-2021.csv', sep=';')
sodra2020 = pd.read_csv('monthly-2020.csv', sep=';')
sodra2019 = pd.read_csv('monthly-2019.csv', sep=';')
sodra2018 = pd.read_csv('monthly-2018.csv', sep=';')
sodra = pd.concat([sodra2024, sodra2023, sodra2022, sodra2021, sodra2020, sodra2019, sodra2018])
sodra
Draudėjo kodas (code) | Juridinių asmenų registro kodas (jarCode) | Pavadinimas (name) | Savivaldybė, kurioje registruota(municipality) | Ekonominės veiklos rūšies kodas(ecoActCode) | Ekonominės veiklos rūšies pavadinimas(ecoActName) | Mėnuo (month) | Vidutinis darbo užmokestis (avgWage) | Apdraustųjų skaičius (numInsured) | Vidutinis darbo užmokestis II (avgWage2) | Apdraustųjų skaičius II (numInsured2) | Valstybinio socialinio draudimo įmoka (tax) | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 50764 | NaN | BRITŲ TARYBA | Vilniaus m. sav. | NaN | NaN | 202401 | 2502.17 | 5 | NaN | 0 | 2886.94 |
1 | 42399 | NaN | LATVIJOS RESPUBLIKOS AMBASADA | Vilniaus m. sav. | NaN | NaN | 202401 | NaN | 3 | NaN | 0 | NaN |
2 | 51006 | NaN | LENKIJOS RESPUBLIKOS AMBASADA | Vilniaus m. sav. | NaN | NaN | 202401 | 1470.39 | 24 | NaN | 0 | 8140.29 |
3 | 45838 | NaN | GOETHE-INSTITUT | Vilniaus m. sav. | NaN | NaN | 202401 | 2509.23 | 10 | NaN | 0 | 5568.42 |
4 | 51164 | NaN | RUSIJOS FEDERACIJOS AMBASADOS SOCIALINIO APRŪP... | Vilniaus m. sav. | NaN | NaN | 202401 | 1247.19 | 19 | NaN | 0 | 5271.17 |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
1149677 | 3364589 | 304974057.0 | UAB "AGROFORMA" | Vilniaus m. sav. | 462100.0 | Grūdų, neperdirbto tabako, sėklų ir pašarų gyv... | 201812 | NaN | 1 | NaN | 0 | NaN |
1149678 | 3364528 | 304974096.0 | UAB "ALTO INVESTICIJA" | Šiaulių m. sav. | 467300.0 | Medienos, statybinių medžiagų ir sanitarinių į... | 201812 | NaN | 1 | NaN | 0 | NaN |
1149679 | 3365209 | 304975465.0 | UAB "EKKO LT" | Zarasų r. sav. | 104100.0 | Aliejaus ir riebalų gamyba | 201812 | NaN | 1 | NaN | 0 | NaN |
1149680 | 3365217 | 304975942.0 | NORRONA FACTORY, UAB | Kauno m. sav. | 141900.0 | Kitų drabužių siuvimas ir drabužių priedų gamyba | 201812 | NaN | 1 | NaN | 0 | NaN |
1149681 | 3365507 | 304977968.0 | VIEŠOJI ĮSTAIGA "PANEVĖŽIO KELEIVINIS TRANSPOR... | Panevėžio m. sav. | 469000.0 | Nespecializuota didmeninė prekyba | 201812 | NaN | 1 | NaN | 0 | NaN |
8496812 rows × 12 columns
sodra = sodra.rename(columns={'Draudėjo kodas (code)': 'code', 'Juridinių asmenų registro kodas (jarCode)': 'jarCode', 'Pavadinimas (name)': 'name', 'Savivaldybė, kurioje registruota(municipality)': 'municipality', 'Ekonominės veiklos rūšies kodas(ecoActCode)': 'ecoActCode', 'Ekonominės veiklos rūšies pavadinimas(ecoActName)':'ecoActName','Mėnuo (month)': 'month', 'Vidutinis darbo užmokestis (avgWage)': 'avgWage', 'Apdraustųjų skaičius (numInsured)': 'numInsured', 'Valstybinio socialinio draudimo įmoka (tax)':'tax'})
sodra = sodra.drop(['Vidutinis darbo užmokestis II (avgWage2)', 'Apdraustųjų skaičius II (numInsured2)'], axis=1)
sodra
code | jarCode | name | municipality | ecoActCode | ecoActName | month | avgWage | numInsured | tax | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 50764 | NaN | BRITŲ TARYBA | Vilniaus m. sav. | NaN | NaN | 202401 | 2502.17 | 5 | 2886.94 |
1 | 42399 | NaN | LATVIJOS RESPUBLIKOS AMBASADA | Vilniaus m. sav. | NaN | NaN | 202401 | NaN | 3 | NaN |
2 | 51006 | NaN | LENKIJOS RESPUBLIKOS AMBASADA | Vilniaus m. sav. | NaN | NaN | 202401 | 1470.39 | 24 | 8140.29 |
3 | 45838 | NaN | GOETHE-INSTITUT | Vilniaus m. sav. | NaN | NaN | 202401 | 2509.23 | 10 | 5568.42 |
4 | 51164 | NaN | RUSIJOS FEDERACIJOS AMBASADOS SOCIALINIO APRŪP... | Vilniaus m. sav. | NaN | NaN | 202401 | 1247.19 | 19 | 5271.17 |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
1149677 | 3364589 | 304974057.0 | UAB "AGROFORMA" | Vilniaus m. sav. | 462100.0 | Grūdų, neperdirbto tabako, sėklų ir pašarų gyv... | 201812 | NaN | 1 | NaN |
1149678 | 3364528 | 304974096.0 | UAB "ALTO INVESTICIJA" | Šiaulių m. sav. | 467300.0 | Medienos, statybinių medžiagų ir sanitarinių į... | 201812 | NaN | 1 | NaN |
1149679 | 3365209 | 304975465.0 | UAB "EKKO LT" | Zarasų r. sav. | 104100.0 | Aliejaus ir riebalų gamyba | 201812 | NaN | 1 | NaN |
1149680 | 3365217 | 304975942.0 | NORRONA FACTORY, UAB | Kauno m. sav. | 141900.0 | Kitų drabužių siuvimas ir drabužių priedų gamyba | 201812 | NaN | 1 | NaN |
1149681 | 3365507 | 304977968.0 | VIEŠOJI ĮSTAIGA "PANEVĖŽIO KELEIVINIS TRANSPOR... | Panevėžio m. sav. | 469000.0 | Nespecializuota didmeninė prekyba | 201812 | NaN | 1 | NaN |
8496812 rows × 10 columns
sodra['jarCode'] = sodra['jarCode'].astype('Int64')
sodra['ecoActCode'] = sodra['ecoActCode'].astype('Int64')
sodra['year'] = sodra['month'].astype(str).str[:4]
sodra['year'] = sodra['year'].astype(int)
sodra
code | jarCode | name | municipality | ecoActCode | ecoActName | month | avgWage | numInsured | tax | year | |
---|---|---|---|---|---|---|---|---|---|---|---|
0 | 50764 | <NA> | BRITŲ TARYBA | Vilniaus m. sav. | <NA> | NaN | 202401 | 2502.17 | 5 | 2886.94 | 2024 |
1 | 42399 | <NA> | LATVIJOS RESPUBLIKOS AMBASADA | Vilniaus m. sav. | <NA> | NaN | 202401 | NaN | 3 | NaN | 2024 |
2 | 51006 | <NA> | LENKIJOS RESPUBLIKOS AMBASADA | Vilniaus m. sav. | <NA> | NaN | 202401 | 1470.39 | 24 | 8140.29 | 2024 |
3 | 45838 | <NA> | GOETHE-INSTITUT | Vilniaus m. sav. | <NA> | NaN | 202401 | 2509.23 | 10 | 5568.42 | 2024 |
4 | 51164 | <NA> | RUSIJOS FEDERACIJOS AMBASADOS SOCIALINIO APRŪP... | Vilniaus m. sav. | <NA> | NaN | 202401 | 1247.19 | 19 | 5271.17 | 2024 |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
1149677 | 3364589 | 304974057 | UAB "AGROFORMA" | Vilniaus m. sav. | 462100 | Grūdų, neperdirbto tabako, sėklų ir pašarų gyv... | 201812 | NaN | 1 | NaN | 2018 |
1149678 | 3364528 | 304974096 | UAB "ALTO INVESTICIJA" | Šiaulių m. sav. | 467300 | Medienos, statybinių medžiagų ir sanitarinių į... | 201812 | NaN | 1 | NaN | 2018 |
1149679 | 3365209 | 304975465 | UAB "EKKO LT" | Zarasų r. sav. | 104100 | Aliejaus ir riebalų gamyba | 201812 | NaN | 1 | NaN | 2018 |
1149680 | 3365217 | 304975942 | NORRONA FACTORY, UAB | Kauno m. sav. | 141900 | Kitų drabužių siuvimas ir drabužių priedų gamyba | 201812 | NaN | 1 | NaN | 2018 |
1149681 | 3365507 | 304977968 | VIEŠOJI ĮSTAIGA "PANEVĖŽIO KELEIVINIS TRANSPOR... | Panevėžio m. sav. | 469000 | Nespecializuota didmeninė prekyba | 201812 | NaN | 1 | NaN | 2018 |
8496812 rows × 11 columns
from sqlalchemy import create_engine
def upload_csv_to_mysql(csv_file_path, database_url, table_name):
try:
data = pd.read_csv(csv_file_path)
print(f"CSV file '{csv_file_path}' loaded successfully.\n")
engine = create_engine(database_url)
print(f"Connected to the MySQL database.\n")
data.to_sql(table_name, engine, if_exists='replace', index=False)
print(f"Data uploaded successfully to table '{table_name}'.\n")
except Exception as e:
print(f"An error occurred: {e}\n")
upload_csv_to_mysql(r'C:/Users/Vartotojas/Documents/Datacademy/Baigiamasis/Jupyter/veiklos.csv',
r'mysql://root:sql123@localhost/works',
'veiklos')
CSV file 'C:/Users/Vartotojas/Documents/Datacademy/Baigiamasis/Jupyter/veiklos.csv' loaded successfully. Connected to the MySQL database. Data uploaded successfully to table 'veiklos'.
import mysql.connector
my_db = mysql.connector.connect(
host='localhost',
port='3306',
user='root',
password='sql123'
)
veiklos = pd.read_sql('SELECT * FROM works.veiklos', con=my_db)
# veiklų kodų lentelė yra sutvarkyta PowerBI ir į SQL serverį įkeltI tik šiai analizei reikalingi stulpeliai
veiklos
C:\Users\Vartotojas\AppData\Local\Temp\ipykernel_7472\340231550.py:1: UserWarning: pandas only supports SQLAlchemy connectable (engine/connection) or database string URI or sqlite3 DBAPI2 connection. Other DBAPI2 objects are not tested. Please consider using SQLAlchemy. veiklos = pd.read_sql('SELECT * FROM works.veiklos', con=my_db)
Sekcijos_pavadinimas (groups) | Sekcijos_pavadinimas | Poklasis_pilnas | |
---|---|---|---|
0 | Gamyba | Žemės ūkis, miškininkystė ir žuvininkystė | 10000 |
1 | Gamyba | Žemės ūkis, miškininkystė ir žuvininkystė | 11000 |
2 | Gamyba | Žemės ūkis, miškininkystė ir žuvininkystė | 11100 |
3 | Gamyba | Žemės ūkis, miškininkystė ir žuvininkystė | 11200 |
4 | Gamyba | Žemės ūkis, miškininkystė ir žuvininkystė | 11300 |
... | ... | ... | ... |
1073 | Statyba | Statyba | 433400 |
1074 | Statyba | Statyba | 433900 |
1075 | Statyba | Statyba | 439000 |
1076 | Statyba | Statyba | 439100 |
1077 | Statyba | Statyba | 439900 |
1078 rows × 3 columns
veiklos = veiklos.rename(columns={'Poklasis_pilnas': 'ecoActCode','Sekcijos_pavadinimas (groups)': 'ecoActGroup', 'Sekcijos_pavadinimas':'ecoActName2'})
sodra = pd.merge(sodra, veiklos, how='left', on='ecoActCode')
sodra
code | jarCode | name | municipality | ecoActCode | ecoActName | month | avgWage | numInsured | tax | year | ecoActGroup | ecoActName2 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 50764 | <NA> | BRITŲ TARYBA | Vilniaus m. sav. | <NA> | NaN | 202401 | 2502.17 | 5 | 2886.94 | 2024 | NaN | NaN |
1 | 42399 | <NA> | LATVIJOS RESPUBLIKOS AMBASADA | Vilniaus m. sav. | <NA> | NaN | 202401 | NaN | 3 | NaN | 2024 | NaN | NaN |
2 | 51006 | <NA> | LENKIJOS RESPUBLIKOS AMBASADA | Vilniaus m. sav. | <NA> | NaN | 202401 | 1470.39 | 24 | 8140.29 | 2024 | NaN | NaN |
3 | 45838 | <NA> | GOETHE-INSTITUT | Vilniaus m. sav. | <NA> | NaN | 202401 | 2509.23 | 10 | 5568.42 | 2024 | NaN | NaN |
4 | 51164 | <NA> | RUSIJOS FEDERACIJOS AMBASADOS SOCIALINIO APRŪP... | Vilniaus m. sav. | <NA> | NaN | 202401 | 1247.19 | 19 | 5271.17 | 2024 | NaN | NaN |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
8496807 | 3364589 | 304974057 | UAB "AGROFORMA" | Vilniaus m. sav. | 462100 | Grūdų, neperdirbto tabako, sėklų ir pašarų gyv... | 201812 | NaN | 1 | NaN | 2018 | Prekyba | Didmeninė ir mažmeninė prekyba; variklinių tra... |
8496808 | 3364528 | 304974096 | UAB "ALTO INVESTICIJA" | Šiaulių m. sav. | 467300 | Medienos, statybinių medžiagų ir sanitarinių į... | 201812 | NaN | 1 | NaN | 2018 | Prekyba | Didmeninė ir mažmeninė prekyba; variklinių tra... |
8496809 | 3365209 | 304975465 | UAB "EKKO LT" | Zarasų r. sav. | 104100 | Aliejaus ir riebalų gamyba | 201812 | NaN | 1 | NaN | 2018 | Gamyba | Apdirbamoji gamyba |
8496810 | 3365217 | 304975942 | NORRONA FACTORY, UAB | Kauno m. sav. | 141900 | Kitų drabužių siuvimas ir drabužių priedų gamyba | 201812 | NaN | 1 | NaN | 2018 | Gamyba | Apdirbamoji gamyba |
8496811 | 3365507 | 304977968 | VIEŠOJI ĮSTAIGA "PANEVĖŽIO KELEIVINIS TRANSPOR... | Panevėžio m. sav. | 469000 | Nespecializuota didmeninė prekyba | 201812 | NaN | 1 | NaN | 2018 | Prekyba | Didmeninė ir mažmeninė prekyba; variklinių tra... |
8496812 rows × 13 columns
Darbo užmokesčio ir apdraustųjų skaičiaus kaita 2018 - 2024 metais¶
sodra['month'] = pd.to_datetime(sodra['month'], format='%Y%m')
monthly_data = sodra.groupby('month')['numInsured'].sum().reset_index()
plt.plot(monthly_data['month'], monthly_data['numInsured'])
plt.ylabel('Apdraustųjų skaičius (suminis)')
plt.grid(True)
plt.xticks(rotation=45)
plt.show()
sodra['month'] = pd.to_datetime(sodra['month'], format='%Y%m')
monthly_data = sodra.groupby('month')['avgWage'].mean().reset_index()
plt.plot(monthly_data['month'], monthly_data['avgWage'])
plt.ylabel('Vidutinis atlyginimas')
plt.grid(True)
plt.xticks(rotation=45)
plt.show()
Darbo užmokesčio analizė pagal savivaldybes¶
filtered_data = sodra[(sodra['year'] == 2024) & (sodra['municipality'] != 'Nenustatyta')]
result = filtered_data.groupby(['municipality', 'year'])['avgWage'].mean().reset_index()
result = round(result.sort_values(by='avgWage', ascending=False),2)
result.reset_index(drop=True, inplace=True)
result.index = result.index + 1
result
municipality | year | avgWage | |
---|---|---|---|
1 | Vilniaus m. sav. | 2024 | 1888.37 |
2 | Kauno m. sav. | 2024 | 1567.26 |
3 | Klaipėdos m. sav. | 2024 | 1562.42 |
4 | Kauno r. sav. | 2024 | 1495.50 |
5 | Vilniaus r. sav. | 2024 | 1449.36 |
6 | Kėdainių r. sav. | 2024 | 1409.37 |
7 | Trakų r. sav. | 2024 | 1406.05 |
8 | Neringos sav. | 2024 | 1377.08 |
9 | Elektrėnų sav. | 2024 | 1376.75 |
10 | Birštono sav. | 2024 | 1373.67 |
11 | Panevėžio m. sav. | 2024 | 1363.89 |
12 | Širvintų r. sav. | 2024 | 1349.56 |
13 | Mažeikių r. sav. | 2024 | 1348.20 |
14 | Klaipėdos r. sav. | 2024 | 1347.73 |
15 | Jonavos r. sav. | 2024 | 1338.46 |
16 | Alytaus m. sav. | 2024 | 1335.76 |
17 | Kupiškio r. sav. | 2024 | 1335.13 |
18 | Šiaulių m. sav. | 2024 | 1330.32 |
19 | Joniškio r. sav. | 2024 | 1329.29 |
20 | Ukmergės r. sav. | 2024 | 1301.97 |
21 | Rietavo sav. | 2024 | 1301.07 |
22 | Šakių r. sav. | 2024 | 1300.95 |
23 | Pakruojo r. sav. | 2024 | 1293.56 |
24 | Kaišiadorių r. sav. | 2024 | 1290.80 |
25 | Utenos r. sav. | 2024 | 1290.47 |
26 | Akmenės r. sav. | 2024 | 1288.74 |
27 | Plungės r. sav. | 2024 | 1288.56 |
28 | Marijampolės sav. | 2024 | 1284.62 |
29 | Prienų r. sav. | 2024 | 1276.74 |
30 | Pagėgių sav. | 2024 | 1270.89 |
31 | Varėnos r. sav. | 2024 | 1268.19 |
32 | Palangos m. sav. | 2024 | 1263.54 |
33 | Skuodo r. sav. | 2024 | 1263.33 |
34 | Šiaulių r. sav. | 2024 | 1262.24 |
35 | Biržų r. sav. | 2024 | 1258.87 |
36 | Kretingos r. sav. | 2024 | 1258.59 |
37 | Šilalės r. sav. | 2024 | 1256.08 |
38 | Pasvalio r. sav. | 2024 | 1252.14 |
39 | Ignalinos r. sav. | 2024 | 1251.70 |
40 | Druskininkų sav. | 2024 | 1251.31 |
41 | Raseinių r. sav. | 2024 | 1247.67 |
42 | Anykščių r. sav. | 2024 | 1247.52 |
43 | Panevėžio r. sav. | 2024 | 1245.65 |
44 | Radviliškio r. sav. | 2024 | 1245.00 |
45 | Kelmės r. sav. | 2024 | 1241.63 |
46 | Molėtų r. sav. | 2024 | 1227.81 |
47 | Telšių r. sav. | 2024 | 1226.83 |
48 | Tauragės r. sav. | 2024 | 1221.52 |
49 | Kalvarijos sav. | 2024 | 1220.87 |
50 | Šilutės r. sav. | 2024 | 1215.99 |
51 | Alytaus r. sav. | 2024 | 1207.84 |
52 | Rokiškio r. sav. | 2024 | 1205.80 |
53 | Jurbarko r. sav. | 2024 | 1204.82 |
54 | Švenčionių r. sav. | 2024 | 1196.33 |
55 | Vilkaviškio r. sav. | 2024 | 1191.94 |
56 | Kazlų Rūdos sav. | 2024 | 1185.84 |
57 | Lazdijų r. sav. | 2024 | 1168.75 |
58 | Zarasų r. sav. | 2024 | 1164.45 |
59 | Šalčininkų r. sav. | 2024 | 1114.86 |
60 | Visagino sav. | 2024 | 1036.01 |
Darbo užmokesčio analizė pagal veiklos sektorių¶
filtered_data2 = sodra[(sodra['year'] == 2024)]
result2 = filtered_data2.groupby(['ecoActName2'])['avgWage'].mean().reset_index()
result2 = round(result2.sort_values(by='avgWage', ascending=False),2)
result2.reset_index(drop=True, inplace=True)
result2.index = result2.index + 1
result2
ecoActName2 | avgWage | |
---|---|---|
1 | Finansinė ir draudimo veikla | 3053.51 |
2 | Informacija ir ryšiai | 2869.26 |
3 | Viešasis valdymas ir gynyba; privalomasis soci... | 2342.78 |
4 | Profesinė, mokslinė ir techninė veikla | 2051.51 |
5 | Elektros, dujų, garo tiekimas ir oro kondicion... | 1952.97 |
6 | Švietimas | 1712.77 |
7 | Kasyba ir karjerų eksploatavimas | 1560.67 |
8 | Vandens tiekimas nuotekų valymas, atliekų tvar... | 1549.07 |
9 | Žmonių sveikatos priežiūra ir socialinis darbas | 1539.45 |
10 | Administracinė ir aptarnavimo veikla | 1534.66 |
11 | Didmeninė ir mažmeninė prekyba; variklinių tra... | 1532.43 |
12 | Apdirbamoji gamyba | 1505.50 |
13 | Nekilnojamojo turto operacijos | 1423.00 |
14 | Meninė, pramoginė ir poilsio organizavimo veikla | 1382.79 |
15 | Transportas ir saugojimas | 1380.22 |
16 | Žemės ūkis, miškininkystė ir žuvininkystė | 1333.79 |
17 | Statyba | 1297.95 |
18 | Apgyvendinimo ir maitinimo paslaugų veikla | 1013.45 |
19 | Ekstrateritorinių organizacijų ir įstaigų veikla | 989.15 |
20 | Kita aptarnavimo veikla | 928.17 |
21 | Namų ūkių, samdančių darbininkus, veikla; namų... | 465.98 |
Darbo užmokesčio analizė pagal įmonių dydį¶
def companySize(x):
if x >= 250:
return 'Stambi'
elif 50 <= x <= 249:
return 'Vidutinė'
elif 10 <= x <= 49:
return 'Maža'
else:
return 'Smulki'
sodra['companySize'] = sodra['numInsured'].apply(companySize)
sodra
code | jarCode | name | municipality | ecoActCode | ecoActName | month | avgWage | numInsured | tax | year | ecoActGroup | ecoActName2 | companySize | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 50764 | <NA> | BRITŲ TARYBA | Vilniaus m. sav. | <NA> | NaN | 2024-01-01 | 2502.17 | 5 | 2886.94 | 2024 | NaN | NaN | Smulki |
1 | 42399 | <NA> | LATVIJOS RESPUBLIKOS AMBASADA | Vilniaus m. sav. | <NA> | NaN | 2024-01-01 | NaN | 3 | NaN | 2024 | NaN | NaN | Smulki |
2 | 51006 | <NA> | LENKIJOS RESPUBLIKOS AMBASADA | Vilniaus m. sav. | <NA> | NaN | 2024-01-01 | 1470.39 | 24 | 8140.29 | 2024 | NaN | NaN | Maža |
3 | 45838 | <NA> | GOETHE-INSTITUT | Vilniaus m. sav. | <NA> | NaN | 2024-01-01 | 2509.23 | 10 | 5568.42 | 2024 | NaN | NaN | Maža |
4 | 51164 | <NA> | RUSIJOS FEDERACIJOS AMBASADOS SOCIALINIO APRŪP... | Vilniaus m. sav. | <NA> | NaN | 2024-01-01 | 1247.19 | 19 | 5271.17 | 2024 | NaN | NaN | Maža |
... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... | ... |
8496807 | 3364589 | 304974057 | UAB "AGROFORMA" | Vilniaus m. sav. | 462100 | Grūdų, neperdirbto tabako, sėklų ir pašarų gyv... | 2018-12-01 | NaN | 1 | NaN | 2018 | Prekyba | Didmeninė ir mažmeninė prekyba; variklinių tra... | Smulki |
8496808 | 3364528 | 304974096 | UAB "ALTO INVESTICIJA" | Šiaulių m. sav. | 467300 | Medienos, statybinių medžiagų ir sanitarinių į... | 2018-12-01 | NaN | 1 | NaN | 2018 | Prekyba | Didmeninė ir mažmeninė prekyba; variklinių tra... | Smulki |
8496809 | 3365209 | 304975465 | UAB "EKKO LT" | Zarasų r. sav. | 104100 | Aliejaus ir riebalų gamyba | 2018-12-01 | NaN | 1 | NaN | 2018 | Gamyba | Apdirbamoji gamyba | Smulki |
8496810 | 3365217 | 304975942 | NORRONA FACTORY, UAB | Kauno m. sav. | 141900 | Kitų drabužių siuvimas ir drabužių priedų gamyba | 2018-12-01 | NaN | 1 | NaN | 2018 | Gamyba | Apdirbamoji gamyba | Smulki |
8496811 | 3365507 | 304977968 | VIEŠOJI ĮSTAIGA "PANEVĖŽIO KELEIVINIS TRANSPOR... | Panevėžio m. sav. | 469000 | Nespecializuota didmeninė prekyba | 2018-12-01 | NaN | 1 | NaN | 2018 | Prekyba | Didmeninė ir mažmeninė prekyba; variklinių tra... | Smulki |
8496812 rows × 14 columns
filtered_data3 = sodra[(sodra['year'] == 2024)]
result3 = filtered_data3.groupby(['companySize'])['avgWage'].mean().reset_index()
result3 = round(result3.sort_values(by='avgWage', ascending=False),2)
result3.reset_index(drop=True, inplace=True)
result3.index = result3.index + 1
result3
companySize | avgWage | |
---|---|---|
1 | Stambi | 2193.89 |
2 | Vidutinė | 2074.44 |
3 | Maža | 1764.57 |
4 | Smulki | 1291.33 |
Įmonių grupių pagal dydį pasiskirstymas skirtinguose veiklos sektoriuose¶
fig, ax = plt.subplots(2, 2, figsize=(10, 6))
fig.suptitle('Įmonių dydžių pasiskirstymas skirtinguose sektoriuose (2024)', fontsize=16)
gamyba2024 = sodra[(sodra['ecoActGroup'] == 'Gamyba') & (sodra['year'] == 2024)]
company_size_counts = gamyba2024['companySize'].value_counts()
ax[0, 0].pie(company_size_counts, labels=company_size_counts.index, autopct='%1.1f%%', pctdistance=1.0, labeldistance=1.3)
ax[0, 0].set_title('Gamyba')
prekyba2024 = sodra[(sodra['ecoActGroup'] == 'Prekyba') & (sodra['year'] == 2024)]
company_size_counts = prekyba2024['companySize'].value_counts()
ax[0, 1].pie(company_size_counts, labels=company_size_counts.index, autopct='%1.1f%%', pctdistance=1.0, labeldistance=1.3)
ax[0, 1].set_title('Prekyba')
paslaugos2024 = sodra[(sodra['ecoActGroup'] == 'Paslaugos') & (sodra['year'] == 2024)]
company_size_counts = paslaugos2024['companySize'].value_counts()
ax[1, 0].pie(company_size_counts, labels=company_size_counts.index, autopct='%1.1f%%',pctdistance=1.0, labeldistance=1.3)
ax[1, 0].set_title('Paslaugos')
statyba2024 = sodra[(sodra['ecoActGroup'] == 'Statyba') & (sodra['year'] == 2024)]
company_size_counts = statyba2024['companySize'].value_counts()
ax[1, 1].pie(company_size_counts, labels=company_size_counts.index, autopct='%1.1f%%', pctdistance=1.0, labeldistance=1.3)
ax[1, 1].set_title('Statyba')
plt.tight_layout()
Išvados¶
Vidutiniai darbo užmokesčiai didmiesčiuose yra didesni, lyginant su mažesnėmis savivaldybėmis.¶
Hipotezė pasitvirtino. Duomenys rodo, kad didmiesčiuose vidutiniai darbo užmokesčiai yra aukštesni nei mažesnėse savivaldybėse. Tai gali būti dėl didesnio ekonominės veiklos intensyvumo ir didesnės paklausos kvalifikuotai darbo jėgai didžiuosiuose miestuose.
Informacinių technologijų sektoriuje vidutiniai atlyginimai didesni nei kituose sektoriuose.¶
Hipotezė nepasitvirtino. Nors informacinių technologijų sektorius yra antras pagal vidutinį atlyginimą (2869.26 Eur), pirmoje vietoje yra finansinė ir draudimo veikla, kur vidutinis darbo užmokestis siekia 3053.51 Eur.
Daugiausiai stambių įmonių yra gamybos sektoriuje.¶
Hipotezė pasitvirtino. Analizuojant įmonių pasiskirstymą Lietuvoje pagal sektorius, nustatyta, kad gamybos sektorius yra tas, kuriame yra daugiausia stambių įmonių. Tai gali būti siejama su tuo, jog gamybos sektorius reikalauja didesnės darbo jėgos, todėl čia yra didesnė stambių įmonių koncentracija.
Stambios įmonės moka didesnį vidutinį darbo užmokestį nei mažesnės įmonės.¶
Hipotezė pasitvirtino. Analizė parodė, kad stambios įmonės moka didesnį vidutinį darbo užmokestį, palyginti su mažesnėmis įmonėmis. Tai gali būti dėl didesnių išteklių ir finansinių galimybių, leidžiančių stambioms įmonėms mokėti didesnius atlyginimus.
Duomenų šaltiniai¶
- Sodros duomenys https://atvira.sodra.lt/imones/rinkiniai/index.html
- Veiklų kodai https://osp.stat.gov.lt/600
Pastabos¶
Duomenys apie vidutinį darbo užmokestį nagrinėti remiantis Sodros duomenimis. Atlyginimų informacija yra pateikta apie įmones turinčias daugiau nei 4 darbuotojus. Dėl duomenų trūkumo informacija gali būti netiksli.
Atlyginimai pateikiami neatskaičius mokesčių (Brutto).
Darbą atliko: Toma Zujevaitė, 2025