Notebook – BIVIET

Lỗi khi convert pandas dataframe qua spark dataframe 4.9 (18)

By adminPosted on 2024-09-17Posted in Data Integration, Microsoft Fabric, NotebookTagged data, fabric, pyspark, pythonNo Comments

Ví dụ: import pandas as pdimport pyspark.pandas as psfrom pyspark.sql import SparkSession # Giả sử bạn đã đọc dữ liệu từ Excel bằng Pandasdf_pandas = pd.read_excel(“your_file.xlsx”) # Chuyển đổi cột thời gian từ time64[us] sang string để tránh lỗidf_pandas[‘time_column’] = df_pandas[‘time_column’].astype(str) # Sau đó chuyển Pandas DataFrame sang Spark DataFramespark = SparkSession.builder.getOrCreate()df_spark = spark.createDataFrame(df_pandas) # […]

Tạo UDF (User-Defined Funtion) 4.6 (27)

By adminPosted on 2024-09-11Posted in Data Integration, Microsoft Fabric, NotebookTagged fabric, notebook, pysparkNo Comments

Định dạng ngày giờ (Format) Ví dụ Ghi Chú %Y-%m-%d %H:%M:%S.%f 2024-09-06 12:30:45.123456 %Y-%m-%d %H:%M:%S 2024-09-06 12:30:45 %Y-%m-%d %H:%M 2024-09-06 12:30 %Y/%m/%d %H:%M:%S.%f 2024/09/06 12:30:45.123456 %Y/%m/%d %H:%M:%S 2024/09/06 12:30:45 %Y/%m/%d %H:%M 2024/09/06 12:30 %b %d %Y %I:%M%p Sep 06 2024 12:30PM Các format mẫu trong code Dùng code trên để đổi các column_name trong data […]

Cách thiết lập và nhận return value của Pipeline và Notebook trên Data Factory 4.9 (23)

By adminPosted on 2024-09-03Posted in NotebookTagged fabric, pyspark, python, return valueNo Comments

1. Variable Type: Pipeline Variable2. Name: Chọn variable giữ kết quả trả về. 　　➡Ở đây mình chọn “return_value” variable3. Value: Thiết lập kết quả trả về là kết quả sử lý của bước xữ lý trước đó. 　　➡Ở đây mình bỏ qua và cố định giá trị trả về là 1 chuỗi “Đây là kết […]

M	T	W	T	F	S	S
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31