Rick van der Lans
R20/Consultancy
De wereld van business intelligence en data warehousing wordt de laatste jaren geconfronteerd met een niet aflatende stroom technologieën en daarbij moet een steeds bredere groep gebruikers ondersteund worden. Big Data is de grote aanjager van de meeste van deze veranderingen. Big Data heeft geleid tot de introductie van nieuwe gegevensopslag-technologieën, zoals Hadoop, NoSQL en NewSQL, en tot nieuwe platformen voor gegevensverwerking, zoals Spark en Storm. En voor streaming analytics zijn onder andere Kafka en Streams geïntroduceerd. Maar ook de gegevensconsumptie is niet ongewijzigd gebleven. Naast klassieke en interactieve rapporten moeten BI-omgevingen ook ondersteuning bieden voor self-service BI, investigative analytics en data science. De lat voor BI lijkt elk jaar weer hoger gelegd te worden.
Maar de grote vraag is: hoe moeten deze nieuwe gebruikerswensen ondersteund worden en wat is de beste manier om al deze nieuwe technologieën te integreren met traditionele datawarehouse systemen? Wanneer dienen Hadoop en NoSQL ingezet te worden? Kan Spark gebruikt worden als datamart? Welke modules van Hadoop dienen voor welke toepassing ingezet te worden? Wat is de relatie tussen een datawarehouse en een op Hadoop-gebaseerd data lake? Wat kan wel en niet met de nieuwe technologieën?
Tijdens dit seminar worden al deze nieuwe Big Data technologieën kritisch besproken. Wat is hun geheim? Hoe kunnen zij opvallend meer verwerken dan de traditionele databaseservers? Voor- en nadelen worden toegelicht en mogelijkheden en technische eigenschappen worden besproken. Na het seminar heeft u een gedegen en compleet overzicht van deze snel veranderende wereld van Big Data technologie en hoe deze in te zetten bij BI-systemen.
Rick van der Lans geeft in deze intensieve dag antwoord op o.a. de volgende vragen.
Dit seminar is voor een ieder bestemd die vanuit zijn functie op de hoogte moet blijven van de ontwikkelingen op database- en datawarehousegebied, zoals databasespecialisten, databasebeheerders, datawarehouse- en databaseontwerpers, database-experts, consultants, technology planners, projectleiders en systeemanalisten.
Bovenaan de pagina bij Downloads kunt u de volledige PDF brochure downloaden.
Van der Valk Hotel Utrecht
Winthontlaan 4-6
3526 KV Utrecht
Telefoon 030 8000 800
The hotel is very well accessible by public transport. From busstop ‘Kanaleneiland Zuid’ it is only a three-minute walk. You can take buses 63, 65, 66, 74 and 77 from Utrecht Central Station and you also take the tram line 20 or 21 from the train station and get off at stop ‘Kanaleneiland’. Please consult www.9292.nl (door-to-door journey planner, also available in English) or call 0900-9292 (travel advice by phone, € 0.70 p/m).
Van der Valk Hotel Utrecht is also located next to the highway A12, exit 17 (Utrecht / Jaarbeurs / Kanaleneiland).
Although the hotel has a large parking garage, we cannot guarantee parking spots. We therefore advise you to go by public transport.
For those who would like to arrive the day before, there is the possibility of staying at the Van der Valk Hotel Utrecht. However, the hotel does not provide special discounts for attendees of events. Therefore, when interested in an overnight stay, please consult Van der Valk directly to make a reservation.
More information about the hotel and the location can be found on their website www.vandervalkhotelutrecht.nl.
Het programma start om 9:30 uur en duurt tot 17:00 uur. Registratie is mogelijk vanaf 8:30 uur.
Ontvangst, registratie en uitreiking documentatie
1. De komst van Big Data en Fast Data
• Nieuwe BI-vormen, waaronder data science, investigative analytics en streaming analytics
• Het inzetten van Big Data om een concurrentievoordeel te krijgen
• Verschillen tussen semi-structured, poly-structured, multi-structured en unstructured data
• Voorbeelden van Big Data: sensordata, (micro-)eventdata en clickstream data
• Fast Data = Big Data + fast analytics + fast reactions
• Het belang van meer schaalbaarheid en query performance
2. De wereld van Hadoop, NoSQL en Spark toegelicht
• De Hadoop stack: HDFS, MapReduce, Hive, Spark, HBase, YARN, ZooKeeper, Pig, HCatalog, enzovoorts
• Alternatieve implementaties onder andere van MapR, Amazon (Hadoop as a service) en ScaleOut (Hadoop in-memory)
• MapReduce of Spark voor analytics en reporting?
• Classificatie van NoSQL producten: key-value stores, document stores, column-family stores en graph data stores
• Marktoverzicht, inclusief Apache HBase, Cassandra, CouchDB, Cloudera, DataStax, MongoDB, Neo4j en Riak
3. Big SQL oplossingen: SQL-on-Hadoop, NewSQL en analytical SQL databaseservers
• Hoe volwassen zijn de huidige SQL-on-Hadoop oplossingen?
• Marktoverzicht van SQL-on-Hadoop engines, inclusief Apache Drill, Apache Hive, Apache Phoenix, Cloudera Impala, HP Vertica, JethroData, Spark SQL en Splice Machine
• Classificatie van analytical SQL databaseservers
• De voor- en nadelen van kolomgebaseerde opslagstructuren
• Wat is in-database analytics en wat is de relatie met Google’s MapReduce?
• Marktoverzicht, inclusief Apache Greenplum, Exasol, HP Vertica, IBM PureData Systems for Analytics, InfoBright, JustOneDB, Kognitio WX2, Microsoft PDW, Oracle In-Memory, SAP HANA en Sybase IQ, SnowflakeDB, Teradata Appliances en Teradata Aster Database
• NewSQL betekent high-performance transactie-georiënteerde SQL systemen
• Simpelere transactiemechanismen om scale-out te realiseren
• Het voorkomen van multi-table joins die niet geparallelliseerd kunnen worden
• Marktoverzicht inclusief Akiban, Clustrix, GenieDB, NuoDB en VoltDB
4. Technologieën voor Fast Data en streaming analytics
• De grootste toepassing van Fast Data: het Internet of Things (IoT)
• IoT betekent streaming data en snel analyseren van die data
• IoT devices: Smartphones (horloges), RFID sensoren, machines, algemene sensoren, cameras, pace makers, enzovoorts
• De uitdaging: real-time reacties op streaming data
• De verschillen tussen Big Data en fast Big Data
• Technologieën voor streaming data: Apache Kafka, Apache ActiveMQ, Amazon Kinesis, Kestrel, RabbitMQ en ZeroMQ
• Verschillen tussen de nieuwe technologieën en traditionele message queuing producten
• Voorbeelden van producten voor Big Data streaming: Apache Storm en Flink, IBM InfoSphere Streams, Informatica for Streaming Analytics, Software AG Apama en Spark Streaming
• Hoe integreren we Fast Data met het enterprise data warehouse?
5. Integreren van Big Data technologie in datawarehouse systemen
• Gebruiken van Hadoop en Spark in datawarehouse systemen
• Hadoop als staging area, datawarehouse, data mart of archiveringsgebied
• Datawarehouse gegevens beschikbaar stellen voor rapportage en analyse met SQL-on-Hadoop engines
• Gebruik van datavirtualisatie om gegevens te integreren die opgeslagen zijn in Hadoop, NoSQL- en SQL-systemen
• De mogelijke rol van NoSQL
6. Ontwikkelen van data lakes met Big Data technologie
• Wat is een data lake?
• Welke technologieën zijn geschikt voor het ontwikkelen van data lakes?
• Is het realistisch om een fysiek data lake op te bouwen met Big Data?
• Het ontwikkelen van een virtueel of logisch data lake met datavirtualisatie-servers
• Let op de technische en business metadata!
7. Data Science, Big Data Technologie en het datawarehouse
• Wat is data science en waarom is het anders dan analytics?
• Wat hebben MapReduce en Spark data scientists te bieden?
• Kunnen we standaard BI tools, zoals QlikView en Tableau, gebruiken in samenwerking met Spark?
• Hadoop als sandbox voor geavanceerde vormen van analytics
• De waarde van graph databases voor data science, zoals AllegroGraph, InfiniteGraph en Neo4J
8. Samenvatting en afsluiting
Taking part in this workshop will only cost 625,50 Euro when registering 30 days beforehand and 695 Euro per person after the Early Bird period expires (excl. 21% Dutch VAT). This also covers documentation, lunch, tea/coffee.
In completing your registration form you declare that you agree with our Terms and Conditions.
Extra discounts
Discounts are available for group bookings of two or more delegates representing the same organization made at the same time. Ten percent off for the second and third delegate and fifteen percent off for all delegates when registering four or more delegates (all delegates must be listed on the same invoice).
This cannot be used in conjunction with other discounts.
Payment
Full payment is due prior to the event. An invoice will be sent to you containing our full bank details including BIC and IBAN. Your payment should always include the invoice number as well as the name of your company and the delegate name.
Practically all of our seminars and workshops can be offered as an In-house course for your company exclusively. We can tailor with extra focus on specific topics that apply to your organization. Also available in online format or in face-to-face format with live video stream.
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office
Datamanagement approach to the EU-GDPR legislation (Dutch spoken) The new European General Data Protection Regulation (GDPR) will come into effect in May of 2018. Avoid fines and reputation damage. This workshop, hosted by our GDPR specialist, adresses a concrete datamanagement approach so you can take adequate measures on time.
Only available as In-house
At your office