Conheça os seus dados



Gujarati Empresa Tecnologia

1. Objetivos pedagógicos dessas atividades

2. Determinantes dos diferenciais de salário

Em uma grande empresa foi executada uma pesquisa para estudar os salários do pessoal trabalhando na área de computação. O objetivo da pesquisa era identificar e quantificar os fatores que determinam os diferenciais de salário.

3. Inspiração + dados

Usaremos o banco de dados da Gujarati empresa de tecnologia. O significado de cada variável é detalhado a seguir:

4. Pacotes necessários

Vamos usar quatro pacotes do R: readxl, dplyr, ggplot2, e ggthemes.

library(dplyr)
library(ggplot2)

5. Carregar os dados

Use esse código para ler o banco de dados disponível em https://github.com/DATAUNIRIO/Base_de_dados

O banco de dados se chama gujarati_empresa_tecnologia.xlsx e está armazenado no repositório de bases de dados do curso de estatística. Você pode usar esse código se quiser ler o arquivo xlsx local.


library(readxl)
gujarati <- read_excel("SEU DIRETÓRIO ATÉ O ARQUIVO/gujarati_empresa_tecnologia.xlsx")
as variáveis consideradas foram 



6. Conheça os seus dados

Tente responder a todas essas perguntas. (opcional: tente responder todas perguntas usando somente o pacote dplyr).

  1. Quantas pessoas com graduação completa existem na empresa Gujarati?
  2. Qual é o salário mais baixo da empresa? Qual a escolaridade dessa pessoa? Qual a experiência?


6 Análises descritivas dos dados

  1. Qual a proporção de pessoas com pós-graduação na empresa Gujarati?
  2. Qual a proporção de pessoas com pós-graduação exercendo cargos administrativos na empresa Gujarati?

7 Se você quiser mais:

  1. Qual o impacto da escolaridade no salário?
  2. O fato de ter um cargo administrativo influência no salário?

8. Mais um desafio:

  1. Qual o impacto da experiência no salário?
  2. Seria possível criar uma nova variável com base na escolaridade? Faça uma nova variável com base na codificação abaixo:

Nova classificação:
UNIV = “ensino médio” (se Educ=1)
UNIV = “ensino superior” (se Educ=2 ou Educ=3)

  1. Existe algum efeito no salário da interação do fato da pessoa estar em cargo administrativo (atividade meio) ou não (atividade fim da empresa) com a educação?

Não é obrigatório, mas para fazer a análise para responder a pergunta acima, será necessário criar uma nova variável. Essa variável deverá ser a combinação da EDUC com ADM (exemplo: qual o salário médio de uma pessoa com ensino superior e cargo administrativo?).

9. Um último desafio

  1. Faça a transformação da experiência em três faixas de experiência.
  1. Quantas pessoas estão em cada categoria dessa nova variável faixas de experiência ?

  2. Qual o salário médio, mediano e o desvio-padrão de cada categoria dessa nova variável faixas de experiência?

  3. Existe algum efeito no salário da interação da (faixa de) experiência com a educação?

  4. Existe alguma forma de avaliar o impacto simultâneo das variáveis experiência, educação e cargo administrativo no salário?

  5. Você conseguria refazer e interpretar um dos gráficos abaixo?

DICA: o primeiro gráfico foi feito com a função plot() do R básico.
DICA 2: o segundo foi feito com a função xyplot do pacote lattice.
DICA 3: Esse gráfico tambe poderia ser feito com a função geom_point do pacote ggplot2