Data Mining Extensions
Data Mining Extensions (DMX) er et spørrespråk for å modellere datautvinning som støttes av Microsoft-verktøyet SQL Server Analysis Services (SSAS).[1]
I likhet med SQL støtter den et datadefinisjonsspråk, datamanipuleringsspråk og et dataspørringsspråk, og alle tre har SQL-lignende syntaks. Mens SQL-uttrykk opererer på relasjonstabeller opererer DMX-uttrykk på datautvinningsmodeller.
Tilsvarende støtter SQL Server MDX-språket for OLAP-databaser. DMX brukes til å lage og trene modeller for datautvinning, og til å bla gjennom, administrere og predikere modeller. DMX er sammensatt av datadefinisjonsspråk (DDL)-setninger, datamanipulasjonsspråk (DML)-setninger, samt funksjoner og operatorer.
Spørringer
[rediger | rediger kilde]DMX-spørringer formuleres ved hjelp av SELECT
-uttrykk. De kan trekke ut informasjon fra eksisterende datautvinningsmodeller på ulike måter.
Datadefinisjonsspråk
[rediger | rediger kilde]Datadefinisjonsspråk-delen av DMX kan brukes til å:
- Lage nye datautvinnings-modeller og -strukturer (
CREATE MINING STRUCTURE, CREATE MINING MODEL
) - Slette eksisterende datautvinnings-modeller og -strukturer (
DROP MINING STRUCTURE, DROP MINING MODEL
) - Eksport og import av utvinningsstrukturer (
EXPORT, IMPORT
) - Kopiere data fra en utvinningsmodell til en annen (
SELECT INTO
)
Datamanipulasjonsspråk
[rediger | rediger kilde]Datamanipulasjonsspråk-delen av DMX kan brukes til å:
- Trene utvinningsmodeller (
INSERT INTO
) - Bla gjennom data i utvinningsmodeller (
SELECT FROM
) - Lage prediksjoner ved å bruke utvinningsmodeller (
SELECT ...
FROM PREDICTION JOIN
)
Eksempel: En prediksjonsspørring
[rediger | rediger kilde]Følgende eksempel er en enkel prediksjonsspørring som predikerer om en gitt kunde vil være interessert i boliglånsprodukter:
SELECT
[Loan Seeker],
PredictProbability([Loan Seeker])
FROM
[Decision Tree]
NATURAL PREDICTION JOIN
(SELECT
35 AS [Age],
'Y' AS [House Owner],
'M' AS [Marital Status],
'F' AS [Gender],
2 AS [Number Cars Owned],
2 AS [Total Children],
18 AS [Total Years of Education]
)
Referanser
[rediger | rediger kilde]- ^ «Sql server - Explain how to use DMX-the data mining query language». Besøkt 23. august 2022.