Catégorie > High Tech

Framework pour charger des données d’Oracle vers Azure

Posté par Dino, mise à jour le 11/05/2026 à 10:10:10

Processus étape par étape pour créer un framework Python afin d’extraire et charger des données d’Oracle et de les charger dans le stockage de blob Azure et le pool dédié Azure avec un extrait de code.

Oracle est un système de gestion de bases de données relationnelles (SGBDR) populaire utilisé par de nombreuses organisations pour stocker et gérer leurs données. Cependant, avec l’avènement de l’informatique en nuage, de nombreuses organisations se tournent vers des solutions basées sur le cloud pour leurs besoins en stockage et traitement de données. Azure Blob Storage et Synapse Dedicated SQL Pool sont deux solutions cloud populaires proposées par Microsoft pour stocker et traiter les données. Dans cet article, nous allons explorer comment créer un framework pour charger des données d’Oracle vers Azure Blob Storage sous forme de fichier Parquet, puis les charger dans Synapse Dedicated SQL Pool.

Étape 1 : Configurer le stockage de blob Azure


La première étape de ce processus consiste à configurer Azure Blob Storage. Vous pouvez le faire en créant un compte Azure puis en créant un compte de stockage. Une fois que vous avez créé un compte de stockage, vous pouvez créer un conteneur dans le compte de stockage où vous stockerez le fichier Parquet. Veillez à noter la chaîne de connexion du compte de stockage ainsi que le nom du conteneur, car vous en aurez besoin plus tard.

Étape 2 : Installer les bibliothèques requises


Ensuite, vous devez installer les bibliothèques nécessaires pour interagir avec Oracle et Azure Blob Storage. Vous pouvez utiliser les commandes suivantes pour installer les bibliothèques :

Python

pip install cx_Oracle
ip install azure-storage-blob


Étape 3 : Connectez-vous à Oracle


Après avoir installé les bibliothèques requises, vous devez vous connecter à Oracle. Vous pouvez utiliser le code suivant pour créer une connexion :

Python

import cx_Oracle
conn = cx_Oracle.connect('username/password@hostname:port/servicename')


Remplacez le nom d’utilisateur, le mot de passe, le nom d’hôte, le port et le nom du service par les valeurs appropriées pour votre base de données Oracle.


Étape 4 : Requête des données d’Oracle


Une fois que vous avez établi une connexion avec Oracle, vous pouvez interroger les données que vous souhaitez transférer vers Azure Blob Storage. Vous pouvez utiliser le code suivant pour interroger les données :

Python

import pandas as pd
query = 'SELECT * FROM my_table'
df = pd.read_sql(query, conn)
Replace my_table with the name of the table that you want to query.


Étape 5 : Écrire les données dans un fichier Parquet


Après avoir interrogé les données, vous devez les écrire dans un fichier Parquet. Vous pouvez utiliser le code suivant pour écrire les données dans un fichier Parquet :

Python

import pyarrow as pa
import pyarrow.parquet as pq
table = pa.Table.from_pandas(df)
pq.write_table(table, 'my_file.parquet')
Replace my_file.parquet with the name that you want to give to the Parquet file.


Étape 6 : Téléverser le fichier Parquet vers Azure Blob Storage


Une fois que vous avez créé le fichier Parquet, vous devez le télécharger sur Azure Blob Storage. Vous pouvez utiliser le code suivant pour téléverser le fichier :

Python

from azure.storage.blob import BlobServiceClient
connection_string = 'DefaultEndpointsProtocol=https;AccountName=myaccount;AccountKey=mykey;EndpointSuffix=core.windows.net'
container_name = 'my_container'
blob_name = 'my_file.parquet'
blob_service_client = BlobServiceClient.from_connection_string(connection_string)
blob_client = blob_service_client.get_blob_client(container_name, blob_name)
with open('my_file.parquet', 'rb') as data:
blob_client.upload_blob(data)


Remplacez , , et par les valeurs appropriées pour votre compte de stockage et votre conteneur. Remplacez aussi par le nom du fichier Parquet que vous avez créé à l’étape 5.myaccountmykeymy_containermy_file.parquet

Étape 7 : Charger le fichier Parquet dans le pool SQL dédié Synapse


La dernière étape consiste à charger le fichier Parquet depuis Azure Blob Storage vers Synapse Dedicated SQL Pool. Vous pouvez utiliser le code suivant pour créer une source de données externe dans le Synapse Dedicated SQL Pool :

Python

CREATE MASTER KEY ENCRYPTION BY PASSWORD = 'password';
CREATE DATABASE SCOPED CREDENTIAL cred_name
WITH IDENTITY = 'username',
SECRET = 'password';
CREATE EXTERNAL DATA SOURCE data_source_name
WITH (
TYPE = HADOOP,
LOCATION = 'wasbs://container_name@account_name.blob.core.windows.net',
CREDENTIAL = cred_name
);


Remplacez , , , et par les valeurs appropriées pour votre compte Azure Blob Storage et votre conteneur.passwordusernameaccount_namecontainer_name

Ensuite, vous pouvez utiliser le code suivant pour créer une table externe dans Synapse Dedicated SQL Pool :

Python

CREATE EXTERNAL TABLE external_table_name
(
column1 datatype1,
column2 datatype2,
...
)
WITH (
LOCATION = '/path/to/parquet/file',
DATA_SOURCE = data_source_name,
FILE_FORMAT = 'parquet'
);


Remplacez , , , et ainsi de suite par les valeurs appropriées pour votre table externe.external_table_namecolumn1datatype1

Enfin, vous pouvez utiliser le code suivant pour insérer des données de la table externe vers une table régulière dans Synapse Dedicated SQL Pool :

Python

INSERT INTO regular_table_name
SELECT column1, column2, ...
FROM external_table_name;


Remplacez , , , et ainsi de suite par les valeurs appropriées pour votre table régulière.regular_table_namecolumn1column2

Conclusion


Dans cet article, nous avons discuté de la manière de créer un framework pour charger des données d’Oracle vers Azure Blob Storage sous forme de fichier Parquet, puis les charger dans Synapse Dedicated SQL Pool. En suivant ces étapes, vous pouvez facilement transférer vos données d’Oracle vers Synapse Dedicated SQL Pool et profiter des avantages des solutions cloud pour vos besoins de stockage et de traitement des données.



Ajouter une réponse

Votre message :

:

Votre prénom:

Votre email:

:



A voir aussi :

Les dernières discussions:



Qui est Réponse Rapide?

Réponse rapide est un site internet communautaire. Son objectif premier est de permettre à ses membres et visiteurs de poser leurs questions et d’avoir des réponses en si peu de temps.

Quelques avantages de réponse rapide :

Vous n’avez pas besoins d’être inscrit pour poser ou répondre aux questions.
Les réponses et les questions des visiteurs sont vérifiées avant leurs publications.
Parmi nos membres, des experts sont là pour répondre à vos questions.
Vous posez vos questions et vous recevez des réponses en si peu de temps.

Note :

En poursuivant votre navigation, vous acceptez l'utilisation de cookies. En savoir plus