In [1]:
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

In [2]:
df = pd.read_csv("2016-FCC-New-Coders-Survey-Data.csv")


/usr/local/lib/python3.5/site-packages/IPython/core/interactiveshell.py:2723: DtypeWarning: Columns (21,57) have mixed types. Specify dtype option on import or set low_memory=False.
  interactivity=interactivity, compiler=compiler, result=result)

In [3]:
df


Out[3]:
Age AttendedBootcamp BootcampFinish BootcampFullJobAfter BootcampLoanYesNo BootcampMonthsAgo BootcampName BootcampPostSalary BootcampRecommend ChildrenNumber ... ResourceSoloLearn ResourceStackOverflow ResourceTreehouse ResourceUdacity ResourceUdemy ResourceW3Schools ResourceYouTube SchoolDegree SchoolMajor StudentDebtOwe
0 28.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN 20000.0
1 22.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN 1.0 NaN NaN some college credit, no degree NaN NaN
2 19.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN high school diploma or equivalent (GED) NaN NaN
3 26.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Cinematography And Film 7000.0
4 20.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN NaN
5 34.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree English NaN
6 23.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Computer Science NaN
7 35.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN master's degree (non-professional) Education NaN
8 33.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN bachelor's degree Business Administration NaN
9 33.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN master's degree (non-professional) Business Administration 180000.0
10 57.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Computer Science NaN
11 23.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN NaN
12 47.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 1.0 NaN NaN bachelor's degree Mechanical Engineering NaN
13 NaN 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Business Administration 12000.0
14 37.0 0.0 NaN NaN NaN NaN NaN NaN NaN 1.0 ... NaN NaN NaN 1.0 NaN NaN NaN some college credit, no degree NaN NaN
15 31.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN professional degree (MBA, MD, JD, etc.) Math NaN
16 27.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN bachelor's degree Economics NaN
17 29.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Music NaN
18 30.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Music NaN
19 30.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN some college credit, no degree NaN NaN
20 32.0 0.0 NaN NaN NaN NaN NaN NaN NaN 1.0 ... NaN NaN NaN 1.0 1.0 NaN NaN master's degree (non-professional) Geology NaN
21 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Computer Science NaN
22 29.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Computer Science NaN
23 44.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 1.0 NaN NaN bachelor's degree Political Science 50000.0
24 21.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN bachelor's degree Computer Science NaN
25 21.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN 40000.0
26 28.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN high school diploma or equivalent (GED) NaN NaN
27 28.0 0.0 NaN NaN NaN NaN NaN NaN NaN 2.0 ... NaN NaN 1.0 NaN NaN NaN NaN trade, technical, or vocational training NaN NaN
28 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Political Science NaN
29 35.0 0.0 NaN NaN NaN NaN NaN NaN NaN 1.0 ... NaN NaN NaN NaN NaN NaN NaN master's degree (non-professional) Physics NaN
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
15590 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Computer Science NaN
15591 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN professional degree (MBA, MD, JD, etc.) Computer Systems Networking and Telecommunicat... NaN
15592 43.0 0.0 NaN NaN NaN NaN NaN NaN NaN 1.0 ... NaN NaN NaN NaN NaN NaN NaN high school diploma or equivalent (GED) NaN NaN
15593 29.0 1.0 0.0 NaN 0.0 NaN Camp Code Away NaN 0.0 NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Accounting NaN
15594 36.0 0.0 NaN NaN NaN NaN NaN NaN NaN 2.0 ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Engineering NaN
15595 30.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some high school NaN NaN
15596 30.0 0.0 NaN NaN NaN NaN NaN NaN NaN 2.0 ... NaN NaN NaN NaN NaN NaN NaN high school diploma or equivalent (GED) NaN NaN
15597 30.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN professional degree (MBA, MD, JD, etc.) Law NaN
15598 28.0 0.0 NaN NaN NaN NaN NaN NaN NaN 1.0 ... NaN NaN NaN 1.0 NaN NaN NaN associate's degree Computer and Information Systems Security 12000.0
15599 37.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN NaN
15600 28.0 1.0 1.0 1.0 0.0 4.0 Epicodus 36000.0 1.0 NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Marketing NaN
15601 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 1.0 NaN NaN bachelor's degree Criminal Justice and Safety Studies NaN
15602 22.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN bachelor's degree Mathematics NaN
15603 33.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Computer Science NaN
15604 35.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN 1.0 NaN NaN some college credit, no degree NaN NaN
15605 31.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN high school diploma or equivalent (GED) NaN NaN
15606 43.0 0.0 NaN NaN NaN NaN NaN NaN NaN 3.0 ... NaN NaN NaN NaN 1.0 NaN NaN bachelor's degree Physics NaN
15607 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN 1.0 NaN NaN no high school (secondary school) NaN NaN
15608 43.0 0.0 NaN NaN NaN NaN NaN NaN NaN 2.0 ... NaN NaN NaN 1.0 NaN NaN NaN professional degree (MBA, MD, JD, etc.) Electrical Engineering NaN
15609 33.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Software Engineering 15000.0
15610 29.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN master's degree (non-professional) Religious Studies 26000.0
15611 37.0 0.0 NaN NaN NaN NaN NaN NaN NaN 1.0 ... NaN NaN NaN 1.0 NaN NaN NaN professional degree (MBA, MD, JD, etc.) Electrical and Electronics Engineering NaN
15612 45.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN 1.0 NaN NaN some college credit, no degree NaN 30000.0
15613 30.0 0.0 NaN NaN NaN NaN NaN NaN NaN 2.0 ... NaN NaN NaN NaN 1.0 NaN NaN trade, technical, or vocational training NaN NaN
15614 47.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN trade, technical, or vocational training NaN NaN
15615 39.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN 1.0 NaN NaN bachelor's degree Chemistry NaN
15616 27.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN 1.0 NaN NaN NaN NaN bachelor's degree Electrical Engineering NaN
15617 37.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Chemistry NaN
15618 26.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN 1.0 NaN NaN master's degree (non-professional) Math NaN
15619 22.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Graphic Design 40000.0

15620 rows × 113 columns


In [4]:
df.tail()


Out[4]:
Age AttendedBootcamp BootcampFinish BootcampFullJobAfter BootcampLoanYesNo BootcampMonthsAgo BootcampName BootcampPostSalary BootcampRecommend ChildrenNumber ... ResourceSoloLearn ResourceStackOverflow ResourceTreehouse ResourceUdacity ResourceUdemy ResourceW3Schools ResourceYouTube SchoolDegree SchoolMajor StudentDebtOwe
15615 39.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN 1.0 NaN NaN bachelor's degree Chemistry NaN
15616 27.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN 1.0 NaN NaN NaN NaN bachelor's degree Electrical Engineering NaN
15617 37.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Chemistry NaN
15618 26.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN 1.0 NaN NaN master's degree (non-professional) Math NaN
15619 22.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Graphic Design 40000.0

5 rows × 113 columns


In [5]:
df[6:9]


Out[5]:
Age AttendedBootcamp BootcampFinish BootcampFullJobAfter BootcampLoanYesNo BootcampMonthsAgo BootcampName BootcampPostSalary BootcampRecommend ChildrenNumber ... ResourceSoloLearn ResourceStackOverflow ResourceTreehouse ResourceUdacity ResourceUdemy ResourceW3Schools ResourceYouTube SchoolDegree SchoolMajor StudentDebtOwe
6 23.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Computer Science NaN
7 35.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN master's degree (non-professional) Education NaN
8 33.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN bachelor's degree Business Administration NaN

3 rows × 113 columns


In [6]:
df.columns.values


Out[6]:
array(['Age', 'AttendedBootcamp', 'BootcampFinish', 'BootcampFullJobAfter',
       'BootcampLoanYesNo', 'BootcampMonthsAgo', 'BootcampName',
       'BootcampPostSalary', 'BootcampRecommend', 'ChildrenNumber',
       'CityPopulation', 'CodeEventBootcamp', 'CodeEventCoffee',
       'CodeEventConferences', 'CodeEventDjangoGirls', 'CodeEventGameJam',
       'CodeEventGirlDev', 'CodeEventHackathons', 'CodeEventMeetup',
       'CodeEventNodeSchool', 'CodeEventNone', 'CodeEventOther',
       'CodeEventRailsBridge', 'CodeEventRailsGirls',
       'CodeEventStartUpWknd', 'CodeEventWomenCode', 'CodeEventWorkshop',
       'CommuteTime', 'CountryCitizen', 'CountryLive', 'EmploymentField',
       'EmploymentFieldOther', 'EmploymentStatus', 'EmploymentStatusOther',
       'ExpectedEarning', 'FinanciallySupporting', 'Gender', 'HasChildren',
       'HasDebt', 'HasFinancialDependents', 'HasHighSpdInternet',
       'HasHomeMortgage', 'HasServedInMilitary', 'HasStudentDebt',
       'HomeMortgageOwe', 'HoursLearning', 'ID.x', 'ID.y', 'Income',
       'IsEthnicMinority', 'IsReceiveDiabilitiesBenefits', 'IsSoftwareDev',
       'IsUnderEmployed', 'JobApplyWhen', 'JobPref', 'JobRelocateYesNo',
       'JobRoleInterest', 'JobRoleInterestOther', 'JobWherePref',
       'LanguageAtHome', 'MaritalStatus', 'MoneyForLearning',
       'MonthsProgramming', 'NetworkID', 'Part1EndTime', 'Part1StartTime',
       'Part2EndTime', 'Part2StartTime', 'PodcastChangeLog',
       'PodcastCodeNewbie', 'PodcastCodingBlocks', 'PodcastDeveloperTea',
       'PodcastDotNetRocks', 'PodcastHanselminutes', 'PodcastJSJabber',
       'PodcastJsAir', 'PodcastNone', 'PodcastOther',
       'PodcastProgrammingThrowDown', 'PodcastRubyRogues',
       'PodcastSEDaily', 'PodcastShopTalk', 'PodcastTalkPython',
       'PodcastWebAhead', 'ResourceBlogs', 'ResourceBooks',
       'ResourceCodeWars', 'ResourceCodecademy', 'ResourceCoursera',
       'ResourceDevTips', 'ResourceEdX', 'ResourceEggHead', 'ResourceFCC',
       'ResourceGoogle', 'ResourceHackerRank', 'ResourceKhanAcademy',
       'ResourceLynda', 'ResourceMDN', 'ResourceOdinProj', 'ResourceOther',
       'ResourcePluralSight', 'ResourceReddit', 'ResourceSkillCrush',
       'ResourceSoloLearn', 'ResourceStackOverflow', 'ResourceTreehouse',
       'ResourceUdacity', 'ResourceUdemy', 'ResourceW3Schools',
       'ResourceYouTube', 'SchoolDegree', 'SchoolMajor', 'StudentDebtOwe'], dtype=object)

In [7]:
df.describe()


/Users/sz2472/.virtualenvs/pandas/lib/python3.5/site-packages/numpy/lib/function_base.py:3823: RuntimeWarning: Invalid value encountered in percentile
  RuntimeWarning)
Out[7]:
Age AttendedBootcamp BootcampFinish BootcampFullJobAfter BootcampLoanYesNo BootcampMonthsAgo BootcampPostSalary BootcampRecommend ChildrenNumber CodeEventBootcamp ... ResourceReddit ResourceSkillCrush ResourceSoloLearn ResourceStackOverflow ResourceTreehouse ResourceUdacity ResourceUdemy ResourceW3Schools ResourceYouTube StudentDebtOwe
count 13613.000000 15380.000000 933.000000 635.000000 934.000000 631.000000 330.000000 937.000000 2554.000000 42.0 ... 29.0 36.0 30.0 191.0 422.0 3306.0 4130.0 121.0 121.0 3514.000000
mean 29.175421 0.061964 0.689175 0.584252 0.332976 9.055468 63740.506061 0.785486 1.896241 1.0 ... 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 34556.143711
std 9.017716 0.241097 0.463080 0.493239 0.471531 12.968035 26347.200265 0.410704 1.115975 0.0 ... 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 54423.139781
min 10.000000 0.000000 0.000000 0.000000 0.000000 0.000000 6000.000000 0.000000 0.000000 1.0 ... 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 0.000000
25% NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
50% NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
75% NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
max 86.000000 1.000000 1.000000 1.000000 1.000000 220.000000 200000.000000 1.000000 18.000000 1.0 ... 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1.0 1000000.000000

8 rows × 85 columns

1. the youngest programmer vs. the oldest programmer?


In [8]:
df['Age'].describe()


/Users/sz2472/.virtualenvs/pandas/lib/python3.5/site-packages/numpy/lib/function_base.py:3823: RuntimeWarning: Invalid value encountered in percentile
  RuntimeWarning)
Out[8]:
count    13613.000000
mean        29.175421
std          9.017716
min         10.000000
25%               NaN
50%               NaN
75%               NaN
max         86.000000
Name: Age, dtype: float64

2. What are the maximum income for female programmers?


In [9]:
df.groupby('Gender')['Income'].describe()


/Users/sz2472/.virtualenvs/pandas/lib/python3.5/site-packages/numpy/lib/function_base.py:3823: RuntimeWarning: Invalid value encountered in percentile
  RuntimeWarning)
Out[9]:
Gender            
agender      count        14.000000
             mean      25035.714286
             std       23329.136854
             min        6000.000000
             25%                NaN
             50%                NaN
             75%                NaN
             max      100000.000000
female       count      1429.000000
             mean      42982.739678
             std       29822.084583
             min        6000.000000
             25%                NaN
             50%                NaN
             75%                NaN
             max      200000.000000
genderqueer  count        37.000000
             mean      36306.270270
             std       27917.346046
             min        6000.000000
             25%                NaN
             50%                NaN
             75%                NaN
             max      150000.000000
male         count      5815.000000
             mean      45520.715391
             std       36918.883898
             min        6000.000000
             25%                NaN
             50%                NaN
             75%                NaN
             max      200000.000000
trans        count        21.000000
             mean      37714.285714
             std       25820.811097
             min        9000.000000
             25%                NaN
             50%                NaN
             75%                NaN
             max      114000.000000
Name: Income, dtype: float64

3. how much does a programmer make on average per year?


In [10]:
df['Income'].describe()


/Users/sz2472/.virtualenvs/pandas/lib/python3.5/site-packages/numpy/lib/function_base.py:3823: RuntimeWarning: Invalid value encountered in percentile
  RuntimeWarning)
Out[10]:
count      7329.000000
mean      44930.010506
std       35582.783216
min        6000.000000
25%                NaN
50%                NaN
75%                NaN
max      200000.000000
Name: Income, dtype: float64

4. what is the most common major programmers studied?


In [11]:
df['SchoolMajor'].value_counts()


Out[11]:
Computer Science                                              1387
Information Technology                                         408
Business Administration                                        284
Economics                                                      252
Electrical Engineering                                         220
English                                                        204
Psychology                                                     187
Electrical and Electronics Engineering                         164
Software Engineering                                           159
Liberal Arts                                                   157
Engineering                                                    148
Computer Programming                                           147
Mechanical Engineering                                         141
Physics                                                        132
Political Science                                              131
Graphic Design                                                 129
Information Systems                                            119
History                                                        118
Biology                                                        115
Finance                                                        114
Mathematics                                                    108
Communications                                                 103
Computer Software Engineering                                  103
Math                                                           101
Accounting                                                     101
Philosophy                                                      96
Business Administration and Management                          83
Computer and Information Studies                                80
Linguistics                                                     78
Music                                                           77
                                                              ... 
Intellectual Property Law                                        1
Natural Resources Conservation                                   1
Agricultural Economics                                           1
Surveying Technician                                             1
Construction Engineering Technician                              1
Fashion and Apparel Merchandising                                1
Property Management                                              1
Bookkeeping                                                      1
Criminal Justice and Safety Studies                              1
History Teacher Education                                        1
Welding Engineering Technician                                   1
Community Health and Preventive Medicine                         1
Meteorology                                                      1
Baking and Pastry Arts                                           1
Medical Insurance Billing and Claims                             1
Aerospace Engineering Technician                                 1
Horticultural Sciences                                           1
European and Russian Studies                                     1
Sheet Metal Technology                                           1
Health and Physical Fitness Education                            1
Intelligence                                                     1
Traditional Chinese Medicine                                     1
Fire Science and Fire Fighting                                   1
Education of Individuals with Impairments and Disabilities       1
Music History and Literature                                     1
Respiratory Care Therapy                                         1
Aviation Management and Operations                               1
Radio and Television Broadcasting Technician                     1
Equine Studies                                                   1
Police and Criminal Science                                      1
Name: SchoolMajor, dtype: int64

5.what is the highest degree have these programmers completed?


In [12]:
df['SchoolDegree'].value_counts()


Out[12]:
bachelor's degree                           5644
some college credit, no degree              2268
master's degree (non-professional)          1445
high school diploma or equivalent (GED)     1356
some high school                             764
professional degree (MBA, MD, JD, etc.)      692
associate's degree                           649
trade, technical, or vocational training     443
no high school (secondary school)            258
Ph.D.                                        160
Name: SchoolDegree, dtype: int64

6. rank programmer with the amount of debt


In [13]:
df.sort_values(by='StudentDebtOwe', ascending=False).head()


Out[13]:
Age AttendedBootcamp BootcampFinish BootcampFullJobAfter BootcampLoanYesNo BootcampMonthsAgo BootcampName BootcampPostSalary BootcampRecommend ChildrenNumber ... ResourceSoloLearn ResourceStackOverflow ResourceTreehouse ResourceUdacity ResourceUdemy ResourceW3Schools ResourceYouTube SchoolDegree SchoolMajor StudentDebtOwe
5475 NaN 0.0 NaN NaN NaN NaN NaN NaN NaN 0.0 ... NaN NaN NaN 1.0 1.0 NaN NaN Ph.D. Painting 1000000.0
12823 23.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 1.0 NaN NaN high school diploma or equivalent (GED) NaN 1000000.0
6570 27.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Film and Video Studies 999999.0
14308 26.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN 999999.0
7228 33.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN professional degree (MBA, MD, JD, etc.) Physics 800000.0

5 rows × 113 columns

7. Show programmers are taking loans to attend bootcamp and have full-time job after attending bootcamp?


In [14]:
df[(df['BootcampFullJobAfter']==1) & (df['BootcampLoanYesNo']==1)].head()


Out[14]:
Age AttendedBootcamp BootcampFinish BootcampFullJobAfter BootcampLoanYesNo BootcampMonthsAgo BootcampName BootcampPostSalary BootcampRecommend ChildrenNumber ... ResourceSoloLearn ResourceStackOverflow ResourceTreehouse ResourceUdacity ResourceUdemy ResourceW3Schools ResourceYouTube SchoolDegree SchoolMajor StudentDebtOwe
130 41.0 1.0 1.0 1.0 1.0 11.0 Coder Foundry 75000.0 1.0 3.0 ... NaN NaN NaN NaN 1.0 NaN NaN some college credit, no degree NaN 8000.0
272 38.0 1.0 1.0 1.0 1.0 2.0 DevMountain 50000.0 1.0 NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Structural Engineering NaN
273 35.0 1.0 1.0 1.0 1.0 8.0 The Iron Yard 60000.0 1.0 NaN ... NaN NaN NaN 1.0 NaN NaN NaN bachelor's degree Public Administration 15000.0
505 28.0 1.0 1.0 1.0 1.0 5.0 Free Code Camp is not a bootcamp - please scro... 50000.0 1.0 1.0 ... NaN NaN NaN NaN 1.0 NaN NaN some college credit, no degree NaN 30000.0
1442 NaN 1.0 1.0 1.0 1.0 1.0 Hack Reactor 87000.0 1.0 NaN ... NaN NaN NaN NaN 1.0 NaN NaN NaN NaN NaN

5 rows × 113 columns

8. How many programmers are citizens of United States of America and are ethnic minority?


In [15]:
df[(df['IsEthnicMinority']==1)& (df['CountryCitizen']=='United States of America')]


Out[15]:
Age AttendedBootcamp BootcampFinish BootcampFullJobAfter BootcampLoanYesNo BootcampMonthsAgo BootcampName BootcampPostSalary BootcampRecommend ChildrenNumber ... ResourceSoloLearn ResourceStackOverflow ResourceTreehouse ResourceUdacity ResourceUdemy ResourceW3Schools ResourceYouTube SchoolDegree SchoolMajor StudentDebtOwe
4 20.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN NaN
13 NaN 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Business Administration 12000.0
16 27.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN bachelor's degree Economics NaN
20 32.0 0.0 NaN NaN NaN NaN NaN NaN NaN 1.0 ... NaN NaN NaN 1.0 1.0 NaN NaN master's degree (non-professional) Geology NaN
25 21.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN 40000.0
28 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Political Science NaN
30 24.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN 1.0 NaN NaN some college credit, no degree NaN NaN
34 33.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN bachelor's degree English 44000.0
49 20.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 1.0 NaN NaN high school diploma or equivalent (GED) NaN NaN
66 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Economics NaN
67 27.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 1.0 NaN NaN associate's degree Business Administration NaN
71 37.0 0.0 NaN NaN NaN NaN NaN NaN NaN 1.0 ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN 50000.0
77 36.0 0.0 NaN NaN NaN NaN NaN NaN NaN 1.0 ... NaN NaN NaN 1.0 NaN NaN NaN master's degree (non-professional) Computer Science NaN
82 32.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Electrical Engineering NaN
93 32.0 1.0 1.0 0.0 0.0 8.0 Codify Academy NaN 0.0 NaN ... NaN NaN NaN 1.0 NaN NaN NaN bachelor's degree Biology NaN
96 23.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN 7000.0
99 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN bachelor's degree Anthropology 20000.0
101 31.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Liberal Arts NaN
103 19.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 1.0 NaN NaN some college credit, no degree NaN NaN
110 26.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Biology 11400.0
129 24.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN bachelor's degree Communications NaN
133 22.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Information Technology NaN
138 22.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN 1.0 NaN NaN associate's degree Electrical Engineering NaN
147 34.0 0.0 NaN NaN NaN NaN NaN NaN NaN 1.0 ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN 18000.0
152 29.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN high school diploma or equivalent (GED) NaN NaN
170 29.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN 1.0 NaN NaN NaN NaN professional degree (MBA, MD, JD, etc.) Economics 115000.0
176 26.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Industrial Design 30000.0
177 19.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN NaN
181 27.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN master's degree (non-professional) Finance NaN
199 22.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN some college credit, no degree NaN 2000.0
... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...
15160 22.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN high school diploma or equivalent (GED) NaN NaN
15177 36.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Anthropology 40000.0
15179 28.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Computer Graphics 60000.0
15180 18.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN 15000.0
15186 21.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN NaN
15189 22.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN high school diploma or equivalent (GED) NaN NaN
15193 20.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN high school diploma or equivalent (GED) NaN NaN
15195 19.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN high school diploma or equivalent (GED) NaN NaN
15221 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN 60000.0
15241 23.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN bachelor's degree Biomedical Engineering 50000.0
15261 23.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN 15000.0
15279 19.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 1.0 NaN NaN bachelor's degree Computer Science 69000.0
15291 18.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN high school diploma or equivalent (GED) NaN NaN
15305 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN 1.0 NaN NaN some college credit, no degree NaN 30000.0
15307 21.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some high school NaN NaN
15324 21.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN NaN
15356 30.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN some college credit, no degree NaN 26000.0
15362 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN associate's degree General Studies NaN
15368 19.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN high school diploma or equivalent (GED) NaN NaN
15370 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN 25000.0
15503 40.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 NaN NaN NaN bachelor's degree Information Systems 50000.0
15505 26.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN NaN
15513 19.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN some college credit, no degree NaN 20000.0
15514 23.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN 1.0 1.0 NaN NaN NaN bachelor's degree Math 35000.0
15515 22.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Psychology 55000.0
15563 38.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN 1.0 NaN NaN bachelor's degree Physics NaN
15569 35.0 0.0 NaN NaN NaN NaN NaN NaN NaN 2.0 ... NaN 1.0 NaN NaN NaN NaN NaN bachelor's degree Computer Science 3000.0
15572 48.0 0.0 NaN NaN NaN NaN NaN NaN NaN 2.0 ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Art History 12000.0
15601 25.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN 1.0 1.0 NaN NaN bachelor's degree Criminal Justice and Safety Studies NaN
15614 47.0 0.0 NaN NaN NaN NaN NaN NaN NaN NaN ... NaN NaN NaN NaN NaN NaN NaN trade, technical, or vocational training NaN NaN

1815 rows × 113 columns

9.programmers from which country earn the most?


In [16]:
df.groupby('CountryCitizen')['Income'].sum().sort_values(ascending=False)


Out[16]:
CountryCitizen
United States of America         194609044.0
India                             18026086.0
United Kingdom                    13838710.0
Canada                            13017128.0
Australia                          6241505.0
Brazil                             5003055.0
Russia                             3884165.0
Germany                            3622212.0
Ukraine                            3286720.0
Netherlands (Holland, Europe)      2582216.0
France                             2444481.0
Romania                            2411659.0
Poland                             2316574.0
Mexico                             2314810.0
Spain                              2291985.0
Philippines                        2214142.0
Venezuela                          2105128.0
South Africa                       2092398.0
Nigeria                            1929112.0
Italy                              1916690.0
Portugal                           1668800.0
Ireland                            1531500.0
Sweden                             1343583.0
New Zealand                        1147653.0
Colombia                           1123315.0
Indonesia                          1076398.0
Serbia                             1076200.0
Norway                             1070550.0
China                              1055800.0
Turkey                             1018000.0
                                    ...     
Togo                                 14400.0
Cape Verde                           14000.0
Martinique                           14000.0
Dominica                              9600.0
Angola                                   NaN
Antigua & Barbuda                        NaN
Armenia                                  NaN
Bermuda                                  NaN
Congo                                    NaN
Eritrea                                  NaN
Grenada                                  NaN
Guam                                     NaN
Hawaii                                   NaN
Korea North                              NaN
Kuwait                                   NaN
Lesotho                                  NaN
Libya                                    NaN
Madagascar                               NaN
Mauritius                                NaN
Myanmar                                  NaN
Nambia                                   NaN
Netherland Antilles                      NaN
Nicaragua                                NaN
Palestine                                NaN
Republic of Montenegro                   NaN
Rwanda                                   NaN
Somalia                                  NaN
Tanzania                                 NaN
United Arab Emirates                     NaN
Zambia                                   NaN
Name: Income, dtype: float64

10. How many programmers found jobs after graduating from bootcamp less and equal than 4 months?


In [17]:
df['BootcampMonthsAgo'].value_counts()


Out[17]:
1.0      77
3.0      64
12.0     48
2.0      43
4.0      42
6.0      42
5.0      36
0.0      29
24.0     27
8.0      27
7.0      26
9.0      23
18.0     21
15.0     18
14.0     15
10.0     15
11.0     14
20.0     12
16.0      8
21.0      6
13.0      6
22.0      4
19.0      4
27.0      4
17.0      4
23.0      3
28.0      2
30.0      2
26.0      1
156.0     1
32.0      1
36.0      1
37.0      1
42.0      1
50.0      1
72.0      1
220.0     1
Name: BootcampMonthsAgo, dtype: int64

In [18]:
df[(df['EmploymentStatus']== 'Employed for wages')& (df['BootcampMonthsAgo'] <=4)].head()


Out[18]:
Age AttendedBootcamp BootcampFinish BootcampFullJobAfter BootcampLoanYesNo BootcampMonthsAgo BootcampName BootcampPostSalary BootcampRecommend ChildrenNumber ... ResourceSoloLearn ResourceStackOverflow ResourceTreehouse ResourceUdacity ResourceUdemy ResourceW3Schools ResourceYouTube SchoolDegree SchoolMajor StudentDebtOwe
97 26.0 1.0 1.0 1.0 0.0 3.0 DaVinci Coders 45000.0 0.0 NaN ... NaN NaN NaN NaN 1.0 NaN NaN master's degree (non-professional) Music 80000.0
272 38.0 1.0 1.0 1.0 1.0 2.0 DevMountain 50000.0 1.0 NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Structural Engineering NaN
1803 35.0 1.0 1.0 1.0 0.0 3.0 General Assembly 41600.0 1.0 1.0 ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Liberal Arts NaN
1866 44.0 1.0 1.0 0.0 0.0 3.0 Code Fellows NaN 1.0 NaN ... NaN NaN NaN NaN NaN NaN NaN trade, technical, or vocational training NaN NaN
1913 28.0 1.0 1.0 0.0 0.0 1.0 The Firehose Project NaN 0.0 NaN ... NaN NaN NaN NaN NaN NaN NaN bachelor's degree Information Technology NaN

5 rows × 113 columns

this is a bar chart of programmers' age


In [19]:
df['Age'].hist()


Out[19]:
<matplotlib.axes._subplots.AxesSubplot at 0x10cae72b0>

In [20]:
plt.style.available


Out[20]:
['seaborn-muted',
 'seaborn-whitegrid',
 'seaborn-pastel',
 'seaborn-darkgrid',
 'seaborn-dark',
 'seaborn-colorblind',
 'seaborn-dark-palette',
 'seaborn-paper',
 'seaborn-ticks',
 'grayscale',
 'seaborn-poster',
 'dark_background',
 'seaborn-deep',
 'seaborn-talk',
 'fivethirtyeight',
 'seaborn-bright',
 'classic',
 'ggplot',
 'seaborn-white',
 'seaborn-notebook',
 'bmh']

change the style of the previous plot into fivethirtyeight


In [40]:
plt.style.use('fivethirtyeight')

In [41]:
df['Age'].hist()


Out[41]:
<matplotlib.axes._subplots.AxesSubplot at 0x119f8d240>

customize the chart by changing bin size, xlabelsize, ylabelsize and range


In [23]:
df['Age'].hist(bins=20, xlabelsize=10, ylabelsize=10, range=(0,50))


Out[23]:
<matplotlib.axes._subplots.AxesSubplot at 0x10da676a0>

Make a graph that shows the amount of student debt the first 10 programmes from the dataframe own?


In [42]:
plt.style.use('fivethirtyeight')
df['StudentDebtOwe'].head(10).plot(kind='bar')


Out[42]:
<matplotlib.axes._subplots.AxesSubplot at 0x12c97b780>

In [ ]:


In [ ]: