Basic Data Transformations & Importance of Data Types

Η συγκεκριμένη διάλεξη καλύπτει μια σειρά βασικών μετασχηματισμών που μπορούμε να κάνουμε στο Query Editor / Power Query, δίνοντας ιδιαίτερη έμφαση στην εφαρμογή συγκεκριμένων πρακτικών προκειμένου για την βέλτιστη επεξεργασία των δεδομένων σας. Είναι συνέχεια της προηγούμενης διάλεξης και ο τρόπος που προτείνουμε να την παρακολουθήσει κάποιος έιναι τμηματικά προκειμένου να εφαρμόζει τα βήματα παράλληλα στον Η/Υ του.

Το πρώτο βήμα, αφού έχουμε συνδέσει τα δεδομένα μας με το αρχείο Excel DAX 101.xlsx, είναι να δώσουμε ένα όνομα στο Query που θα είναι κατανοητό και θα περιγράφει τα περιεχόμενα του πίνακα. Κάθετι που κάνουμε αναφορικά με την επεξεργασία των δεδομένων καταγράφεται στην ενότητα "Applied Steps" στα δεξιά της οθόνης και επιλέγοντας ένα βήμα μπορούμε να δούμε πως ήταν τα δεδομένα στο συγκεκριμένο σημείο της επεξεργασίας.

Προτείνεται η ενεργοποίηση της μπάρας συναρτήσεων (επιλέγουμε το "Formula" bar από την καρτέλα View) γιατί αν και δεν είναι προαπαιτούμενο να γνωρίζουμε τον κώδικα του Power Query (πρόκειται για την γλώσσα προγραμματισμού Μ) είναι πολύ χρήσιμο να έχουμε μια high level εικόνα / αίσθηση τι γίνεται στο παρασκήνιο του προγράμματος.

Επίσης, είναι ιδιαίτερα χρήσιμο τόσο για λόγους διαφάνειας αλλά και για να μπορούμε να παρακολουθήσουμε τα βήματα επεξεργασίας των δεδομένων να μετονομάζουμε τα βήματα σε κάτι πιο διακριτό / χαρακτηριστικό του κάθε μετασχηματισμού καθώς και να προσθέτουμε σχόλια περιγράφοντας τη λογική ή τις βασικές παραδοχές (με δεξί κλικ σε κάθε βήμα επιλέγουμε Rename & Properties αντίστοιχα)

Τέλος, ένα από ίσως τα πιο σημαντικά βήματα στην επεξεργασία των δεδομένων μας είναι ο σωστός ορισμός του τύπου των δεδομένων ("Data Types") ειδικά για όσες στήλες περιλαμβάνουν αριθμούς ή ημερομηνίες γιατί το πιο λογικό είναι οτι θα χρειαστεί να κάνουμε υπολογισμούς ή να τα χρησιμοποιήσουμε στις αναφορές μας και αν δεν έχει οριστει σωστά ο τύπος δεδομένων τότε θα εμφανιστεί λάθος. (ένα από τα πιο συχνά λάθη στη χρήση του Power Query / Power BI είναι η παράλειψη ορισμού των σωστών Data Types). Μπορούμε να αλλάξουμε / ορίσουμε τα Data types στο περιβάλλον του Power Query ενώ αντίστοιχα μπορούμε να ορίσουμε το Format της κάθε στήλης στο βασικό μενού του Power BI την καρτέλα Column toolsς π.χ. αν έχουμε ορίσει μια στήλη να έχει data type Currency (fixed decimal) μπορούμε μετά στη καρτέλα (tab) Column tools (αφού έχουμε κάνει Close & Apply στο Query Editor) να πάμε στην ενότητα "Formatting" και να επιλέξουμε ποιο νομισμα ακριβώς θέλουμε, το αν θα έχει δεκαδικά κτλ.


Complete and Continue