Frage im Vorstellungsgespräch bei Avanade

How to identify duplicates using Spark SQL from a datasets