Data Science med Python - eLearning
4.900,00 SEK
- 50 hours
Kursen "Python för dataanalys" täcker grundläggande programmeringskoncept med Python och förklarar även dataanalys, maskininlärning, datavisualisering, webbskrapning och bearbetning av naturligt språk. Du kommer att utveckla en omfattande förståelse för de olika paket och bibliotek som krävs för att utföra olika aspekter av dataanalys.
Nyckelfunktioner
Språk
Kursen och materialet är på engelska
Nivå
Nybörjare - mellannivå
Tillgång
1 års tillgång till självstudieplattformen för eLearning dygnet runt
6 timmar av videomaterial
med 40 timmars rekommenderad studietid & övningar
Praktiker
Virtuella labb, Testsimulering, Slutprojekt
Inget prov
Ingen tentamen för kursen men studenten kommer att få ett intyg om genomförd utbildning
Lärandemål
I slutet av denna eLearning-kurs i Data Science med Python kommer du att kunna:
Få en djupgående förståelse för processer inom datavetenskap, datahantering, datautforskning, datavisualisering, hypoteskonstruktion och testning.
Installera den nödvändiga Python-miljön och andra hjälpverktyg och bibliotek.
Förstå de grundläggande koncepten inom Python-programmering, såsom datatyper, tupler, listor, grundläggande operatorer och funktioner.
Utför avancerade matematiska beräkningar med NumPy-paketet och dess omfattande bibliotek av matematiska funktioner.
Utför avancerade matematiska beräkningar med NumPy-paketet och dess omfattande bibliotek av matematiska funktioner.
Utför vetenskaplig och teknisk beräkning med SciPy-paketet och dess underpaket, såsom Integrate, Optimise, Statistics, IO och Weave.
Utför dataanalys och manipulation med hjälp av datastrukturer och verktyg som finns i Pandas-paketet.
Skaffa expertis inom maskininlärning med hjälp av Scikit-Learn-paketet
Förstå övervakade och oövervakade inlärningsmodeller såsom linjär regression, logistisk regression, klusteranalys, dimensionsreduktion, K-NN och pipeline.
Använd paketet Scikit-Learn för bearbetning av naturligt språk.
Använd matplotlib-biblioteket i Python för datavisualisering
Extrahera värdefull data från webbplatser genom att utföra webbskrapning med Python
Integrera Python med Hadoop och MapReduce
Kursinnehåll
Introduktion till dataanalys
Lektion 01
- Data Science och dess tillämpningar
- Data Science-processen: Del 1
- Data Science-processen: Del 2
Grundläggande Python-programmering
Lektion 02
- Konfigurera Jupyter Notebook
- Python-funktioner
- Python-typer och sekvenser
- Djupdykning i Python-strängar
- Python-demo: Läsning och skrivning av csv-filer
- Datum och tid i Python
- Objekt i Python Map
- Lambda och listförståelse
- Varför Python för dataanalys?
- Python-paket för dataanalys
- StatsModels-paketet
- Scipy-paketet
NumPy
Lektion 03
- Grundläggande om NumPy
- Arrayformer och axlar i NumPy: Del A
- NumPy-arrayers former och axlar: Del B
- Aritmetiska operationer
- Villkorslogik
- Vanliga matematiska och statistiska funktioner i Numpy
- Indexering och skivning
- Filhantering
Linjär algebra
Lektion 03
- Introduktion till linjär algebra
- Skalärer och vektorer
- Skalärprodukt av två vektorer
- Linjär oberoende av vektorer
- Vektorns norm
- Matrisoperationer
- Rang av en matris
- Determinant av en matris och enhetsmatris eller operator
- Inversen av en matris samt egenvärden och egenvektorer
- Kalkyl i linjär algebra
Statistikens grunder
Lektion 05
- Statistikens betydelse med avseende på dataanalys
- Vanliga statistiska termer
- Statistiktyper
- Datakategorisering och typer
- Mätnivåer
- Mått på central tendens
- Mått på spridning
- Slumpmässiga variabler
- Set
- Mått på form (Snedhet & Kurtosis)
- Kovarians och korrelation
Sannolikhetsfördelning
Lektion 06
- Sannolikhet, dess betydelse och sannolikhetsfördelning
- Sannolikhetsfördelning: Binomialfördelning
- Sannolikhetsfördelning: Poissonfördelning
- Sannolikhetsfördelning: Normalfördelning
- Sannolikhetsfördelning: Bernoullifördelning
- Sannolikhetsdensitetsfunktion och massfunktion
- Kumulativ fördelningsfunktion
- Centrala gränsvärdessatsen
- Skattningsteori
Avancerad statistik
Lektion 07
- Distribution
- Kurtosis, skevhet och Students t-fördelning
- Hypotesprövning och mekanism
- Hypotesprövningens utfall: Typ I- och typ II-fel
- Nollhypotes och alternativhypotes
- Konfidensintervall
- Felgränser
- Jämförelse och kontrast mellan T-test och Z-test
- Bayes sats
- Chi-två-fördelning
- Chi2-test och anpassningsgodhet
- Analys av varians eller ANOVA
- ANOVA-terminologi
- Variansuppdelning med Python
- F - Fördelning med Python
- F - Test
Pandor
Lektion 08
- Pandas-serier
- Fråga en serie
- Pandas Dataframes
- Pandas Panel
- Vanliga funktioner i Pandas
- Pandas funktioner för statistiska data, fönsterfunktion
- Pandas-funktioner för data och tidsdifferens
- Kategoriska data
- Arbeta med textdata
- Iteration
- Sortering
- Plotta med Pandas
Dataanalys
Lektion 09
- Förståelse för data
- Typer av data: Strukturerad, Ostrukturerad, Rörig, etc
- Arbeta med data Välja lämpliga verktyg, Datainsamling, Datahantering
- Import och export av data i Python
- Reguljära uttryck i Python
- Manipulera text med reguljära uttryck
- Åtkomst till databaser i Python
Datahantering
Lektion 10
- Förtjusande eller idiomatisk Pandas-kod
- Laddar indexering och omindexering
- Sammanfogning
- Minnesoptimering i Python
- Dataförbehandling: Inläsning av data och borttagning av nullvärden
- Dataförbehandling Fyllning av Null-värden
- Datauppdelning, formatering och normalisering
- Standardisering av datauppdelning i intervall
- Beskriva data
Datavisualisering
Lektion 11
Principer för informationsvisualisering
Visualisera data med pivottabeller
Bibliotek för datavisualisering i Python: Matplotlib
Graftyper
Bibliotek för datavisualisering i Python: Seaborn, Plotly, Bokeh
Använda Matplotlib för att rita grafer
Plotta 3D-diagram för flera kolumner med Matplotlib
Använda Matplotlib med andra Python-paket
Använda Seaborn för att rita grafer
Plotta 3D-diagram för flera kolumner med Seaborn
Introduktion till Plotly och Bokeh
Vem bör anmäla sig till detta program?
Denna kurs är idealisk för personer som är intresserade av att följa en karriär inom datavetenskap, maskininlärning eller artificiell intelligens, och som vill förbättra sina färdigheter inom Python-programmering och dataanalys.
Aspirerande datavetare
Dataanalytiker
Mjukvaruingenjörer eller programmerare
Forskare och akademiker
Maskininlärningsentusiaster
Studenter och akademiker
Förkunskaper
Studerande behöver inneha en kandidatexamen eller en gymnasieexamen. Dessutom uppmuntras en nyfikenhet för dataanalys och en vilja att utforska Python's tillämpningar inom data science. Det rekommenderas också att ha:
- Grundläggande kunskaper i Python-programmering: Bekantskap med grundläggande programmeringskoncept i Python såsom variabler, loopar, funktioner och kontrollflöden.
- Grundläggande förståelse för statistik: En grundläggande förståelse för statistik, inklusive koncept som medelvärde, median, standardavvikelse, sannolikhet och korrelation.
- Matematik: Grundläggande matematikkunskaper, särskilt inom områden som algebra och linjär algebra, kommer att vara till hjälp, speciellt när man arbetar med maskininlärningsalgoritmer eller modeller.
Vanliga frågor
Behöver du en företagslösning eller integration av LMS?
Hittade du inte kursen eller programmet som skulle passa för ditt företag? Behöver du LMS-integration? Skriv till oss! Vi löser det!