Automatisering: fremtiden for datavidenskab og maskinlæring?

Maskinlæring har været en af ​​de største fremskridt i computingens historie og ses nu som værende i stand til at spille en vigtig rolle inden for big data og analyse. Big data -analyse er en kæmpe udfordring i et virksomhedsperspektiv. For eksempel kan aktiviteter som at forstå det store antal forskellige dataformater, analysere dataforberedelse og filtrere redundante data være ressourcekrævende. Rekruttering af datavidenskabelige specialister er et dyrt forslag og ikke et middel til en ende for enhver virksomhed. Eksperter mener, at maskinlæring kan automatisere mange af de opgaver, der er forbundet med analyse - både rutinemæssige og komplekse. Automatiseret maskinlæring kan frigøre betydelige ressourcer, der kan bruges til mere komplekst og innovativt arbejde. Maskinlæring ser ud til at bevæge sig i denne retning hele tiden.

Automatisering i forbindelse med informationsteknologi

I IT er automatisering forbindelsen mellem forskellige systemer og software, så de kan udføre specifikke opgaver uden menneskelig indgriben. I IT kan automatiserede systemer udføre både enkle og komplekse opgaver. Et eksempel på et enkelt job kan være at integrere formularer med PDF-filer og sende dokumenter til den korrekte modtager, mens sikkerhedskopiering uden for stedet kan være et eksempel på et komplekst job.

For at udføre dit job korrekt skal du programmere eller give klare instruktioner til det automatiserede system. Hver gang et automatiseret system er nødvendigt for at ændre omfanget af sit job, skal programmet eller instruktionssættet opdateres af nogen. Selvom det automatiserede system er effektivt i sit job, kan der opstå fejl af forskellige årsager. Når der opstår fejl, skal hovedårsagen identificeres og rettes. For at gøre sit arbejde er et automatiseret system helt afhængigt af mennesker. Jo mere kompleks arbejdets art er, desto større er sandsynligheden for fejl og problemer.

Et almindeligt eksempel på automatisering i IT-branchen er automatisering af test af webbaserede brugergrænseflader. Testcases indføres i automatiseringsskriptet, og brugergrænsefladen testes i overensstemmelse hermed. (For mere om den praktiske anvendelse af maskinlæring, se Machine Learning og Hadoop i detektion af næste generations svig.)

Argumentet til fordel for automatisering er, at det udfører rutinemæssige og gentagelige opgaver og frigør medarbejdere til at udføre mere komplekse og kreative opgaver. Det hævdes imidlertid også, at automatisering har udelukket et stort antal opgaver eller roller, der tidligere var udført af mennesker. Nu, hvor maskinlæring kommer ind i forskellige brancher, kan automatisering tilføje en ny dimension.

Fremtiden for automatiseret maskinlæring?

Essensen i maskinlæring er systemets evne til løbende at lære af data og udvikle sig uden menneskelig indgriben. Maskinlæring er i stand til at fungere som en menneskelig hjerne. Eksempelvis kan anbefalingsmotorer på e-handelswebsteder vurdere en brugers unikke præferencer og smag og give anbefalinger om de mest passende produkter og tjenester at vælge imellem. I betragtning af denne evne ses maskinlæring som ideel til automatisering af komplekse opgaver forbundet med big data og analyse. Det har overvundet de store begrænsninger ved traditionelle automatiserede systemer, der ikke muliggør regelmæssig menneskelig indgriben. Der er flere casestudier, der demonstrerer maskinlærings evne til at udføre komplekse dataanalyseopgaver, som vil blive diskuteret senere i dette papir.

Som allerede bemærket er big data analytics et udfordrende forslag til virksomheder, som delvist kan delegeres til machine learning -systemer. Fra et forretningsmæssigt perspektiv kan dette medføre mange fordele, såsom frigørelse af data science -ressourcer til mere kreative og missionskritiske opgaver, højere arbejdsbyrde, mindre tid til at fuldføre opgaver og omkostningseffektivitet.

Casestudie

I 2015 begyndte MIT -forskere at arbejde på et datavidenskabeligt værktøj, der kan skabe forudsigelige datamodeller ud fra store mængder rådata ved hjælp af en teknik kaldet deep feature synthesis algoritmes. Forskerne hævder, at algoritmen kan kombinere de bedste funktioner i maskinlæring. Ifølge forskerne har de testet det på tre forskellige datasæt og udvider testen til at omfatte flere. I et papir, der skulle præsenteres på den internationale konference om datavidenskab og analyse, sagde forskere James Max Kanter og Kalyan Veeramachaneni: "Ved hjælp af en automatiseret tuningsproces optimerer vi hele vejen uden menneskelig involvering, så den kan generaliseres til forskellige datasæt".

Lad os se på opgavens kompleksitet: Algoritmen har en såkaldt automatisk justeringsfunktion, ved hjælp af hvilken indsigt eller værdier der kan opnås eller ekstraheres fra rådata (f.eks. Alder eller køn), hvorefter forudsigelsesdata modeller kan oprettes. Algoritmen anvender komplekse matematiske funktioner og en sandsynlighedsteori kaldet Gaussian Copula. Det er derfor let at forstå kompleksitetsniveauet, som algoritmen kan håndtere. Denne teknik har også vundet præmier i konkurrencer.

Maskinlæring kan erstatte hjemmearbejde

Det diskuteres rundt om i verden, at maskinlæring kan erstatte mange job, fordi det udfører opgaver med effektiviteten af ​​den menneskelige hjerne. Faktisk er der en vis bekymring for, at maskinlæring vil erstatte dataforskere, og der synes at være et grundlag for en sådan bekymring.

For den almindelige bruger, der ikke har dataanalysefærdigheder, men har forskellige grader af analytiske behov i deres daglige liv, er det ikke muligt at bruge computere, der kan analysere enorme datamængder og levere analysedata. Imidlertid kan Natural Language Processing (NLP) teknikker overvinde denne begrænsning ved at lære computere at acceptere og behandle naturligt menneskeligt sprog. På denne måde har den gennemsnitlige bruger ikke brug for sofistikerede analytiske funktioner eller færdigheder.

IBM mener, at behovet for dataforskere kan minimeres eller elimineres gennem sit produkt, Watson Natural Language Analytics Platform. Ifølge Marc Atschuller, vicepræsident for analytics og business intelligence hos Watson, ”Med et kognitivt system som Watson stiller du bare dit spørgsmål - eller hvis du ikke har et spørgsmål, uploader du bare dine data, og Watson kan se på det og antag hvad du måske vil vide. ”

Konklusion

Automatisering er det næste logiske trin i maskinlæring, og vi oplever allerede virkningerne i vores hverdag-e-handelswebsteder, forslag til Facebook-venner, forslag til LinkedIn-netværk og Airbnb-søgerangeringer. I betragtning af de givne eksempler er der ingen tvivl om, at dette kan tilskrives kvaliteten af ​​output produceret af automatiserede maskinlæringssystemer. På trods af alle dens kvaliteter og fordele virker tanken om maskinlæring, der forårsager enorm arbejdsløshed, lidt af en overreaktion. Maskiner har erstattet mennesker i mange dele af vores liv i årtier, men mennesker har udviklet sig og tilpasset sig til at forblive relevante i branchen. Ifølge opfattelsen er maskinlæring for al dens forstyrrelse blot endnu en bølge, som folk vil tilpasse sig.


Posttid: 03-03-2021